亚洲网站免费_国产一区二区三区在线看麻豆 _国产精品毛片一区二区三区 _麻豆精品网站

百度開源中文主題建模工具集,三種主題模型

2017-06-29 10:09:17 熱度:
百度Familia 開源項(xiàng)目包含文檔主題推斷工具、語義匹配計(jì)算工具以及基于工業(yè)級語料訓(xùn)練的三種主題模型:Latent Dirichlet Allocation(LDA)、SentenceLDA 和Topical Word Embedding(TWE)。 支持用戶以“拿來即用”的方式進(jìn)行文本分類、文本聚類、個(gè)性化推薦等多種場景的調(diào)研和應(yīng)用。考慮到主題模型訓(xùn)練成本較高以及開源主題模型資源有限的現(xiàn)狀,我們會(huì)陸續(xù)開放基于工業(yè)級語料訓(xùn)練的多個(gè)垂直領(lǐng)域的主題模型,以及這些模型在工業(yè)界的典型應(yīng)用方式,助力主題模型技術(shù)的科研和落地。

原文網(wǎng)址:https://github.com/baidu/Familia

責(zé)任編輯:黃焱林

主站蜘蛛池模板: 桑日县| 古浪县| 巴里| 外汇| 阿克苏市| 遵化市| 大厂| 竹北市| 福安市| 峨眉山市| 大埔区| 康马县| 南靖县| 监利县| 莫力| 西乡县| 康乐县| 祁阳县| 昌吉市| 镇远县| 涿鹿县| 大理市| 靖安县| 都江堰市| 海南省| 霍城县| 错那县| 五河县| 祁东县| 商丘市| 澄江县| 三门峡市| 宣恩县| 英吉沙县| 丘北县| 新干县| 且末县| 临江市| 盐城市| 科技| 巴南区|