成人视屏在线观看-国产99精品-国产精品1区2区-欧美一级在线观看-国产一区二区日韩-色九九九

您的位置:首頁技術文章
文章詳情頁

python - 對於不同文件夾的特徵提取策略問題

瀏覽:103日期:2022-08-11 08:43:16

問題描述

問題描述:

有很多文件夾,一個文件夾下有很多文件。目的是將每個文件夾的特徵提取出來,特徵規定是該文件夾下的一個或少量文件(名,內容hash及相對位置)。有什麼較好的算法或策略來解決該問題嗎?

我想的是暴力求解,但這效率低下。直接把該文件夾下的文件與其它文件夾下所有的文件做比較,如果有相同的,則該文件夾的下一個文件又去比較其它所有的,如果不同,則說明這個文件可以表達出該文件夾的特征。然后每個文件夾都這么做。

統計方法。按順序將每個文件夾的文件排序,選最大最小及中位數文件來作每個文件夾的特徵。但會出現這麼個問題,兩個文件夾可能就只有一個或少量文件不同,使用這種策略會產生遺漏,無法準確提取出所有文件夾的特徵。

因此,我希望是在既能保證效率又能保證準確率的情況下來對這問題進行求解。希望各位表哥能隨便提提建議或意見,指導指導。thx。

問題解答

回答1:

將當前文件夾隨機取固定數目個文件,將他們的文件名、大小、修改時間、權限等組合起來做個哈希,然后判重,一般重復率是不會很高的,因為即使文件名和大小一樣,修改時間一般是不一樣的。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 亚洲一区二区三区免费 | 亚洲清纯自偷自拍另类专区 | 爱爱亚洲 | 国产精品黄页网站在线播放免费 | 99re热视频 | 精品视频一区二区 | 欧美三级网站在线观看 | 国产精品黄网站免费进入 | 精品一区二区影院在线 | 男女男免费视频网站国产 | 国产精品青草久久福利不卡 | 91精品亚洲 | 国产成人精品精品欧美 | 国产片一级aaa毛片视频 | 久草在线新首页 | 在线观看黄网视频免费播放 | 亚洲精品高清国产一线久久97 | 天天夜天干天天爽 | 成人影院vs一区二区 | 日韩午夜在线 | 国产玖玖在线观看 | 极品精品国产超清自在线观看 | 欧美一区二区三区不卡 | 成在线人永久免费播放视频 | 国产精品久久久久久久久久一区 | 国产在线精品一区二区夜色 | 久久精品成人一区二区三区 | 亚洲网站www| 久久国产精品免费看 | 亚洲国产一区二区三区综合片 | 欧美一级毛片俄罗斯 | 欧美成人精品不卡视频在线观看 | 男人天堂视频网 | 不卡一级毛片免费高清 | 亚洲国产最新 | 97超级碰碰碰久久久观看 | 久久久国产99久久国产首页 | 亚洲另类激情综合偷自拍 | 亚洲在线视频一区 | 在线亚洲观看 | 日本久久综合网 |