文章詳情頁
python - 用sklearn求大文本的tfidf特征?
瀏覽:138日期:2022-06-27 15:50:07
問題描述
上面的數據是從reuters數據集中取得7303個訓練集,用sklearn對其取tfidf特征,得到的結果都是0,這是怎么回事?
當我從這些數據中取一部分時,對于這些少部分數據能夠得到正確的tfidf結果。
問題解答
回答1:上代碼,可能是你精度太低或者min_count導致的
比如詞頻是1,總詞數1e9,對應的tf就是1e-9,被忽略了。
相關文章:
1. Python中使用超長的List導致內存占用過大2. 實現bing搜索工具urlAPI提交3. python - Django有哪些成功項目?4. Python從URL中提取域名5. MySQL主鍵沖突時的更新操作和替換操作在功能上有什么差別(如圖)6. 關于mysql聯合查詢一對多的顯示結果問題7. node.js - windows10下的npm全局路徑的復原或者將npm徹底刪除?8. 數據庫 - Mysql的存儲過程真的是個坑!求助下面的存儲過程哪里錯啦,實在是找不到哪里的問題了。9. 直接打字符不可以嗎?>和>有區別嗎10. node.js - 微信小程序websocket連接問題
排行榜
