文章詳情頁
python - mongodb去重
瀏覽:152日期:2022-10-14 09:36:55
問題描述
1.功能里需要根據有一個字段來判斷是否重復,比如叫做ownnerId,凡是存在的就丟棄.于是我用到了distinct這個方法,但是這段時間隨著數據量逐漸增大,出現了一個問題:
OperationFailure: distinct too big, 16mb cap
這是命令行里邊的錯誤,說distinct返回的結果太大了,超過了16M.請問各位高手能否貢獻一些方法.
需求:每次通過檢查數據庫中ownnerId這個字段是否出現了,其中數據庫是一直在更新的,而且這個不存在的ownnerId在一會處理后就會存到數據庫中去,所以要求每次判斷都要重新檢查一遍數據庫中這個ownner字段.因此對速度的要求也比較高.各位大神瞅瞅,求給個意見.
問題解答
回答1:如果我理解的對的話,是否考慮過Unique Indexes。
供參考。
Love MongoDB! Have fun!
相關文章:
1. apache web server 怎么限制某一個網站對服務器資源的占用?2. docker網絡端口映射,沒有方便點的操作方法么?3. docker start -a dockername 老是卡住,什么情況?4. java中返回一個對象,和輸出對像的值,意義在哪兒5. css3 - 純css實現點擊特效6. mysql - 在不允許改動數據表的情況下,如何優化以varchar格式存儲的時間的比較?7. 安全性測試 - nodejs中如何防mySQL注入8. docker - 各位電腦上有多少個容器啊?容器一多,自己都搞混了,咋辦呢?9. javascript - 關于apply()與call()的問題10. html5 - 請問現在主流的前端自動化構建工具是哪個?
排行榜
