3 個(gè)令人驚艷的 AI 開(kāi)源項(xiàng)目,誕生了!
大家好,今天繼續(xù)聊聊 AI 科技圈發(fā)生的那些事。分享幾個(gè)最新好玩、實(shí)用的AI工具。
LivePortrait
LivePortrait:一款可以輕松讓一幅肖像栩栩如生的工具
它可以精準(zhǔn)操控眼睛和嘴唇動(dòng)作:
讓靜態(tài)照片變?yōu)榱鲿硠?dòng)態(tài)視頻,顛覆傳統(tǒng)動(dòng)畫(huà)制作,處理多人物肖像無(wú)縫拼接,自然流暢。
解決傳統(tǒng)動(dòng)畫(huà)制作難題,高質(zhì)量高效率,精確控制眼睛和嘴唇動(dòng)作,微表情逼真。
采用先進(jìn)技術(shù)方法,生成速度快,支持多風(fēng)格肖像,提供更多創(chuàng)意空間。
1、克隆代碼并準(zhǔn)備環(huán)境
git clone https://github.com/KwaiVGI/LivePortrait
cd LivePortrait
# create env using conda
conda create -n LivePortrait python==3.9.18
conda activate LivePortrait
# install dependencies with pip
pip install -r requirements.txt
2、下載預(yù)訓(xùn)練權(quán)重
pretrained_weights
├── insightface
│ └── models
│ └── buffalo_l
│ ├── 2d106det.onnx
│ └── det_10g.onnx
└── liveportrait
├── base_models
│ ├── appearance_feature_extractor.pth
│ ├── motion_extractor.pth
│ ├── spade_generator.pth
│ └── warping_module.pth
├── landmark.onnx
└── retargeting_models
└── stitching_retargeting_module.pth
3、推理
python inference.py
GraphRAG
微軟最近開(kāi)源 GraphRAG,構(gòu)建知識(shí)圖譜增強(qiáng)大模型的問(wèn)答、推理等能力
GraphRAG 通過(guò)構(gòu)建實(shí)體知識(shí)圖譜來(lái)增強(qiáng)大模型的搜索、問(wèn)答、摘要、推理等能力,特別擅長(zhǎng)處理大規(guī)模數(shù)據(jù)集。
GraphRAG 的核心包括構(gòu)建實(shí)體知識(shí)圖譜和生成社區(qū)摘要兩個(gè)步驟,通過(guò)社區(qū)摘要提取數(shù)據(jù)集中相關(guān)信息,生成更全面和準(zhǔn)確的答案。
GraphRAG 對(duì) tokens 的需求很低,能夠幫助開(kāi)發(fā)者節(jié)省成本。在綜合測(cè)試中表現(xiàn)優(yōu)異,是目前最佳的RAG方法之一。
基于 Python 的開(kāi)源將在https://aka.ms/graphrag上發(fā)布
Fish Speech
Fish Speech 完美支持中英日語(yǔ)言的開(kāi)源TTS模型
語(yǔ)音處理接近人類水平
模型使用約十五萬(wàn)小時(shí)三語(yǔ)數(shù)據(jù)訓(xùn)練,對(duì)中文支持非常的完美。
該項(xiàng)目由 fishaudio 開(kāi)發(fā),作為一個(gè)僅有億級(jí)參數(shù)的模型,F(xiàn)ish Speech 設(shè)計(jì)高效輕量,可以在個(gè)人設(shè)備上輕松運(yùn)行和微調(diào),成為您的私人語(yǔ)音助手。
使用方法
Github:https://github.com/fishaudio/fish-speech
AI算法交流群(知識(shí)星球)來(lái)了,這是一個(gè)面向全體學(xué)生和機(jī)器學(xué)習(xí)/算法工程師/研究員的技術(shù)溝通和求職交流的平臺(tái)。
在這里你可以了解最前沿AI技術(shù)資訊、Paper、大模型、多模態(tài),算法競(jìng)賽、實(shí)戰(zhàn)項(xiàng)目、獲取AI算法的校招/社招準(zhǔn)備攻略、面試題庫(kù)、面試經(jīng)驗(yàn)分享、Offer選擇、內(nèi)推機(jī)會(huì)、學(xué)習(xí)路線、求職答疑和海量學(xué)習(xí)資料等內(nèi)容。
同時(shí),你也可以與來(lái)自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企開(kāi)發(fā)者互動(dòng)交流~
AI算法交流群方向涉及搜廣推、深度學(xué)習(xí),機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺(jué),知識(shí)圖譜,自然語(yǔ)言處理,大數(shù)據(jù),自動(dòng)駕駛,機(jī)器人,大模型、多模態(tài)等多個(gè)方向。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。