Beautiful Soup軟件介紹
Beautiful Soup官方版是能夠?qū)iT用于對文件分析的專業(yè)操作的工具。Beautiful Soup官方版還能夠直接的可以方便的處理不規(guī)范標記并生成剖析樹。
Beautiful Soup軟件特色
1.Beautiful Soup提供了一些簡單的方法和Python術(shù)語,用于檢索和修改語法樹:一個用于解析文檔并提取相關(guān)信息的工具包。這樣你寫一個應用不需要寫很多代碼。
2.Beautiful Soup自動將輸入文檔轉(zhuǎn)換為Unicode編碼,并將輸出文檔轉(zhuǎn)化為UTF-8編碼。你不需要考慮編碼,除非輸入文檔沒有指出其編碼并且Beautiful Soup無法自動檢測到,這時你需要指出原來的編碼方式。
3.Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上層,這允許你使用不同的解析策略或者犧牲速度來換取靈活性。
Beautiful Soup使用方法
1、解壓文件
將下載得到的壓縮包解壓到任意文件夾,路徑不含中文
2、打開cmd命令提示符
win+r,輸入cmd,回車
進入解壓后的目錄,我這里是C:Python27bs4beautifulsoup4-4.3.2
所以使用
cd C:Python27bs4beautifulsoup4-4.3.2
然后
setup.py build
接著
setup.py install
完成安裝
3、測試
python
import bs4
沒有提示錯誤,成功!
Beautiful Soup更新日志
1.修改用戶提交bug
2.添加新功能