HuggingFace是一個開源的自然語言處理AI工具平臺,它為NLP的開發者和研究者提供了一個簡單、快速、高效、可靠的解決方案,讓NLP變得更加簡單、快速、高效、可靠。
Hugging Face平臺主要包括以下幾個部分:
Transformers:一個提供了數千種預訓練好的NLP模型(如BERT、GPT-3等)以及相應工具包(如PyTorch、TensorFlow等)接口的庫,可以方便地加載、使用、修改、分享這些模型;
Datasets:一個提供了數百種高質量且多樣化的NLP數據集(如SQuAD、GLUE等)以及相應工具包接口(如Pandas等)接口的庫,可以方便地下載、使用、分析、分享這些數據集;
Spaces:一個提供了免費且易用的在線服務平臺,可以方便地部署、展示、測試自己或他人基于Transformers或Datasets構建好的NLP應用或項目;
Hub:一個提供了一個在線的模型和數據集的倉庫,可以方便地瀏覽、搜索、下載、上傳、分享自己或他人的NLP模型和數據集;
Accelerate:一個提供了一個簡單且高效的分布式訓練和推理的工具包,可以方便地在不同的設備和平臺上運行和優化自己的NLP模型;
Tokenizers:一個提供了一個快速且靈活的文本分詞和編碼的工具包,可以方便地處理不同的語言和格式的文本數據;
Course:一個提供了一個免費且實用的NLP在線課程,可以方便地學習和掌握NLP的基礎知識和最新技術。 https://github.com/huggingface/awesome-huggingface
Hugging Face成立于2016年,與其他同期創業公司類似,成立初期奔跑在聊天機器人賽道。
最初,Hugging Face推出一款面向青少年的聊天機器人APP,其用AI技術生成的表情和笑話,旨在為青少年提供情感疏導、娛樂服務。
例如,當用戶發送自拍照,或者是一個悲傷的表情時,聊天機器人能夠做出相應的反應。
然而,公司發展并沒有很大起色,苦于破局的創始人轉向訓練聊天機器人的NLP能力,同時構建了一個底層庫來容納各種機器學習模型和數據集,并且作為開源項目公開發布。
無心插柳柳成蔭,Hugging Face迅速走紅。
如今,聊天機器人早已從App Store中下架,而Hugging Face卻成為GitHub史上增長最快的機器學習庫,其Transformer開源庫累計有96302個Star和20000多個分支。此外,Hugging Face提交共享了166894個訓練模型,26900個數據集。
成立六年多時間里,Hugging Face估值一路沖高。
在去年的C輪融資中,公司估值達20億美元,由Lux Capital領投,紅杉基金等跟投,NBA球星杜蘭特也入股了。
對于取得的這些成績,Clément在機器學習播客中表示:
Hugging Face之所以快速增長是緣于彌補了科學與生產之間的鴻溝,通過搭建平臺為開源界和科學界賦能,所產生的價值比通過搭建專有工具產生的價值要高上千倍。
某種程度上,Hugging Face是在構建人工智能領域的“GitHub”,讓其成為一個由社區開發者驅動的開源平臺。
開放、開源才是正解?
自ChatGpt爆火以來,AI賽道風起云涌。各大科技巨頭爭先恐后入局,搶奪領先地位。在這一背景下,Hugging Face扛起了“開源”的大旗,推出開源版HuggingChat,打破閉源模式ChatGPT的主導地位。在發布HuggingChat的當天,Julien Chaumond發推文稱:有人說封閉的API正在獲勝,但我們永遠不會放棄為開源AI而戰;
Hugging Face · GitHub
Models - Hugging Face
https://blog.csdn.net/a1920993165/article/details/128082968
HuggingFace簡明教程,BERT中文模型實戰示例.NLP預訓練模型,Transformers類庫,datasets類庫快速入門._嗶哩嗶哩_bilibili
HuggingFace簡明教程_weixin_44748589的博客-CSDN博客
Huggingface 超詳細介紹 - 知乎
https://www.cnblogs.com/dongxiong/p/12763923.html