文章詳情頁(yè)
想寫一個(gè)python分析統(tǒng)計(jì)apache 日志文件的腳本
瀏覽:115日期:2022-07-27 15:36:57
問(wèn)題描述
想寫一個(gè)python分析統(tǒng)計(jì)apache 網(wǎng)站日志文件并將統(tǒng)計(jì)后的數(shù)據(jù)存入mysql中的的腳本,有沒(méi)有參考的,沒(méi)有思路主要是統(tǒng)計(jì) 哪些url被爬取了 及 被爬取次數(shù),以及IP這兩個(gè)
問(wèn)題解答
回答1:先把原始數(shù)據(jù) 規(guī)整化,然后 key 值自己定,然后用 collections 的 Counter 統(tǒng)計(jì),然后再遍歷寫入 db, 大概代碼如下:
data = [’/a 1.2.1.2’, ’/b 2.2.2.2’, ’/c 1.1.1.1’, ’/d 2.2.2.2’, ’/d 2.2.2.2’]from collections import Counterc = Counter(data)print c
Counter({’/d 2.2.2.2’: 2, ’/b 2.2.2.2’: 1, ’/a 1.2.1.2’: 1, ’/c 1.1.1.1’: 1})
你也可以自己維護(hù)字典,鍵為:/PATH:IP 或者什么,自己定,然后一邊遍歷,一邊添加就好了
上一條:python - xpath提取網(wǎng)頁(yè)路徑?jīng)]問(wèn)題,但是缺失內(nèi)容?下一條:python sqlalchemy create_engine問(wèn)題
相關(guān)文章:
1. android - NavigationView 的側(cè)滑菜單中如何保存新增項(xiàng)(通過(guò)程序添加)2. html5 - datatables 加載不出來(lái)數(shù)據(jù)。3. 老師 我是一個(gè)沒(méi)有學(xué)過(guò)php語(yǔ)言的準(zhǔn)畢業(yè)生 我希望您能幫我一下4. 除了 python2 和 python3,ipython notebook 還可以用哪些內(nèi)核?5. 這段代碼既不提示錯(cuò)誤也看不到結(jié)果,請(qǐng)老師明示錯(cuò)在哪里,謝謝!6. 提示語(yǔ)法錯(cuò)誤語(yǔ)法錯(cuò)誤: unexpected ’abstract’ (T_ABSTRACT)7. tp5 不同控制器中的變量調(diào)用問(wèn)題8. javascript - vue 元素加樣式該怎么做9. python - Pycharm一句代碼寫完可以自動(dòng)補(bǔ)全空格么?10. php7.3.4中怎么開(kāi)啟pdo驅(qū)動(dòng)
排行榜

熱門標(biāo)簽