探索知识的 无限可能
less
开始探索
发现精彩内容
最新文章
发现最新的思考和分享
如何用模型解决语言问题
如何用模型解决语言问题  **数据标注** -------- 一切的工作始于数据 * [labelstudio ml\_backend simple text classifier文本分类任务机器学习后端](https://terrychan.org/2021/09/labelstudio-ml_backend-simple-text…
解决 XPATH在 Chrome上好用,但不适用于 Scrapy
主要原因是html存在错误,scrapy不能很好的解析,所以这时候就是bs4上来就行了。 找到了答案。事实证明 HTML 已损坏,Scrapy 无法自行修复,因此需要 Beautiful Soup 的帮助。我这样做: ``` from scrapy.selector import Selector from bs4 import BeautifulSoup fixed\_html = str(BeautifulSoup(response.body, "lxml")) print (Selector(text=fixed\_html).xpath('/…
解决 XPATH在 Chrome上好用,但不适用于 Scrapy
主要原因是html存在错误,scrapy不能很好的解析,所以这时候就是bs4上来就行了。 找到了答案。事实证明 HTML 已损坏,Scrapy 无法自行修复,因此需要 Beautiful Soup 的帮助。我这样做: 先安装beautifulsoup4 `pip install beautifulsoup4` ``` from scrapy.selector import Selector from bs4 import BeautifulSoup fixed\_html = str(BeautifulSoup(response.body, "lxm…
解决 XPATH在 Chrome上好用,但不适用于 Scrapy
主要原因是html存在错误,scrapy不能很好的解析,所以这时候就是bs4上来就行了。 找到了答案。事实证明 HTML 已损坏,Scrapy 无法自行修复,因此需要 Beautiful Soup 的帮助。我这样做: 先安装beautifulsoup4 `pip install beautifulsoup4` ``` from scrapy.selector import Selector from bs4 import BeautifulSoup fixed\_html = str(BeautifulSoup(response.body, "lxm…
解决 XPATH在 Chrome上好用,但不适用于 Scrapy
主要原因是html存在错误,scrapy不能很好的解析,所以这时候就是bs4上来就行了。 找到了答案。事实证明 HTML 已损坏,Scrapy 无法自行修复,因此需要 Beautiful Soup 的帮助。我这样做: 先安装beautifulsoup4 `pip install beautifulsoup4` ``` from scrapy.selector import Selector from bs4 import BeautifulSoup fixed\_html = str(BeautifulSoup(response.body, "lxm…
"Google+评论书签栏小工具"
Google+评论书签栏小工具,在任何页面都可以使用 拖动到书签栏 [G+评论](javascript:popw='';Q='';x=document;y=window;if(x.selection) {Q=x.selection.createRange().text;} else if (y.getSelection) {Q=y.getSelection();} else if (x.getSelection) {Q=x.getSelection();}popw = y.open('https://plusone.google.com/_/w…
"Terry Chen shared a post with you"
| | | | --- | --- | | | Terry Chen shared nicole alvar's post with you.ahaha,sexy! | | | | | --- | --- | | | nicole alvar[View or comment on Terry Chen's post »](https://plus.google.com/_/notifications/emlink?emrecipient=110200756825219614165&emid=CKCgxdX2rrECFamZ7Aod…
"*1 Year Later
| | | | --- | --- | | | Terry Chen shared Jay Patel's post with you.哈哈Google plus越來越集成更多的Google服務了, | | | | | --- | --- | | | Jay Patel**1 Year Later: What lessons have you learnt?** [#googleplus](https://plus.google.com/s/%23googleplus) , [#photographydiscussion](htt…
"微软OneNote垃圾中的战斗机"
[](https://3.bp.blogspot.com/-Kr-g5ABhEVg/WYM32u1wCkI/AAAAAAABOVY/AAwoLbWewvIIAWIBHyOrdmF4RyQ9WzTbACLcBGAs/s1600/T…