TerryChan' Blog

文章

标签

喜欢

最新动态

探索知识的 无限可能

less

2330
篇文章
个主题
24/7
更新中

开始探索

发现精彩内容

最新文章

发现最新的思考和分享

2330
篇文章
08月22日 最新更新
212 字 0 次阅读

Linux软件

2023年08月22日

Linux软件 linux下常用软件,对于linux用户可供参考。 Linux软件 ------- ### 输入法 fcitx-rime 小狼毫输入法,很强的。 ### 编辑器 Vsc pycharm jupyter Vim这家伙很神 ### 办公软件 Wps ### 上网浏览器 Chrome 火狐浏览器 ### 娱乐 #### 播放器 VLC 强无敌的播放器。 WebTorrent ### 下载 Linux下的下载软件还真的不少呢。 WebTorrent tixati qbittorrent u…

08月22日
865 字 0 次阅读

如何用模型解决语言问题

2023年08月22日

如何用模型解决语言问题 ![](https://s.w.org/patterns/files/2021/06/image-from-rawpixel-id-430289-jpeg-1-1024x1024.jpg) **数据标注** -------- 一切的工作始于数据 * [labelstudio ml\_backend simple text classifier文本分类任务机器学习后端](https://terrychan.org/2021/09/labelstudio-ml_backend-simple-text…

08月22日
388 字 0 次阅读

解决 XPATH在 Chrome上好用,但不适用于 Scrapy

2023年08月22日

 主要原因是html存在错误,scrapy不能很好的解析,所以这时候就是bs4上来就行了。 找到了答案。事实证明 HTML 已损坏,Scrapy 无法自行修复,因此需要 Beautiful Soup 的帮助。我这样做: ``` from scrapy.selector import Selector from bs4 import BeautifulSoup fixed\_html = str(BeautifulSoup(response.body, "lxml")) print (Selector(text=fixed\_html).xpath('/…

08月22日
435 字 0 次阅读

解决 XPATH在 Chrome上好用,但不适用于 Scrapy

2023年08月22日

 主要原因是html存在错误,scrapy不能很好的解析,所以这时候就是bs4上来就行了。 找到了答案。事实证明 HTML 已损坏,Scrapy 无法自行修复,因此需要 Beautiful Soup 的帮助。我这样做: 先安装beautifulsoup4 `pip install beautifulsoup4` ``` from scrapy.selector import Selector from bs4 import BeautifulSoup fixed\_html = str(BeautifulSoup(response.body, "lxm…

08月22日
435 字 0 次阅读

解决 XPATH在 Chrome上好用,但不适用于 Scrapy

2023年08月22日

 主要原因是html存在错误,scrapy不能很好的解析,所以这时候就是bs4上来就行了。 找到了答案。事实证明 HTML 已损坏,Scrapy 无法自行修复,因此需要 Beautiful Soup 的帮助。我这样做: 先安装beautifulsoup4 `pip install beautifulsoup4` ``` from scrapy.selector import Selector from bs4 import BeautifulSoup fixed\_html = str(BeautifulSoup(response.body, "lxm…

08月22日
435 字 0 次阅读

解决 XPATH在 Chrome上好用,但不适用于 Scrapy

2023年08月22日

 主要原因是html存在错误,scrapy不能很好的解析,所以这时候就是bs4上来就行了。 找到了答案。事实证明 HTML 已损坏,Scrapy 无法自行修复,因此需要 Beautiful Soup 的帮助。我这样做: 先安装beautifulsoup4 `pip install beautifulsoup4` ``` from scrapy.selector import Selector from bs4 import BeautifulSoup fixed\_html = str(BeautifulSoup(response.body, "lxm…

08月22日
743 字 0 次阅读

"Google+评论书签栏小工具"

2023年08月22日

Google+评论书签栏小工具,在任何页面都可以使用 拖动到书签栏 [G+评论](javascript:popw='';Q='';x=document;y=window;if(x.selection) {Q=x.selection.createRange().text;} else if (y.getSelection) {Q=y.getSelection();} else if (x.getSelection) {Q=x.getSelection();}popw = y.open('https://plusone.google.com/_/w…

08月22日
127 字 0 次阅读

"Terry Chen shared a post with you"

2023年08月22日

| | | | --- | --- | | | Terry Chen shared nicole alvar's post with you.ahaha,sexy! | | | | | --- | --- | | | nicole alvar[View or comment on Terry Chen's post »](https://plus.google.com/_/notifications/emlink?emrecipient=110200756825219614165&emid=CKCgxdX2rrECFamZ7Aod…

08月22日
137 字 0 次阅读

"*1 Year Later

2023年08月22日

| | | | --- | --- | | | Terry Chen shared Jay Patel's post with you.哈哈Google plus越來越集成更多的Google服務了, | | | | | --- | --- | | | Jay Patel**1 Year Later: What lessons have you learnt?** [#googleplus](https://plus.google.com/s/%23googleplus) , [#photographydiscussion](htt…

08月22日
340 字 0 次阅读

"微软OneNote垃圾中的战斗机"

2023年08月22日

[![](https://3.bp.blogspot.com/-Kr-g5ABhEVg/WYM32u1wCkI/AAAAAAABOVY/AAwoLbWewvIIAWIBHyOrdmF4RyQ9WzTbACLcBGAs/s320/TIM%25E6%2588%25AA%25E5%259B%25BE20170803224319.jpg)](https://3.bp.blogspot.com/-Kr-g5ABhEVg/WYM32u1wCkI/AAAAAAABOVY/AAwoLbWewvIIAWIBHyOrdmF4RyQ9WzTbACLcBGAs/s1600/T…