<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>爬虫 | Eyte Channel</title><description/><link>https://cc.nostses.icu</link><item><title>#爬虫 #开源 EasySpider 一个完全免费（包括商业使用和二次开发）的可视化浏览器自动化测试/数据采集/爬虫软件，可以使用图形化界面，无代码可视化的设计和执行任务</title><link>https://cc.nostses.icu/posts/1471</link><guid isPermaLink="true">https://cc.nostses.icu/posts/1471</guid><pubDate>Mon, 25 Aug 2025 10:05:43 GMT</pubDate><content:encoded>&lt;div&gt;
      
        &lt;img src=&quot;/static/https://cdn5.telesco.pe/file/PwRDnvH-ILu7TmUFbnDh7VZW7iWbuw492XjrNBSdXiyPP_H_qzdeeMNcN2dhWV60JC3ML3FHJwc-w69hO19oG0HANZcICY4lSwUbXOk4JRt4j7AktE6o5XEwD6-nP2CnInoJdcm4-sVGoxh7J52QGzLHdIn0qyru7-DspBNnXKJjWLHpUVulvEcFJOp7UHD8bSBh23St18JvK19jcPuObDPZxrcu7ABnQnHh7Sv9vChPAiaAiRd1jMQcp0pODM5r24U5oMV7LGHQmR-CnNcO5ysxEv6Sh-KXWhqTVzkq_J5cnv9WiWXPdCWmwrdM0TY4qza6rqg-XHM4CbUQyvHTbg.jpg&quot; alt=&quot;#爬虫 #开源 EasySpider 一个完全免费（包括商业使用和二次开发）的可视化浏览器自动化测试/数据采集/爬虫软件，可以使用图形化界面，无代码可视化的设计和执行任务&quot; loading=&quot;lazy&quot; /&gt;
      
      
        
      
    &lt;/div&gt;&lt;a href=&quot;/search/%23%E7%88%AC%E8%99%AB&quot;&gt;#爬虫&lt;/a&gt; &lt;a href=&quot;/search/%23%E5%BC%80%E6%BA%90&quot;&gt;#开源&lt;/a&gt; &lt;br /&gt;&lt;br /&gt;&lt;b&gt;EasySpider&lt;/b&gt; &lt;br /&gt;&lt;br /&gt;一个完全免费（包括商业使用和二次开发）的可视化浏览器自动化测试/数据采集/爬虫软件，可以使用图形化界面，无代码可视化的设计和执行任务。&lt;br /&gt;&lt;br /&gt;只需要在网页上选择自己想要操作的内容并根据提示框操作即可完成任务的设计和执行，同时还可以单独以命令行的方式进行执行，从而可以很方便的嵌入到其他系统中。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://www.easyspider.net/&quot; target=&quot;_blank&quot;&gt;https://www.easyspider.net&lt;/a&gt; &lt;br /&gt;&lt;br /&gt;频道 &lt;a href=&quot;https://t.me/Edgebyte&quot; target=&quot;_blank&quot;&gt;@Edgebyte&lt;/a&gt;</content:encoded></item><item><title>Crawlee Python：面向现代爬虫与自动化的全栈解决方案，助力高效稳定的数据抓取与网页交互</title><link>https://cc.nostses.icu/posts/1192</link><guid isPermaLink="true">https://cc.nostses.icu/posts/1192</guid><pubDate>Wed, 30 Jul 2025 07:58:24 GMT</pubDate><content:encoded>&lt;a href=&quot;https://github.com/apify/crawlee-python&quot; target=&quot;_blank&quot;&gt;Crawlee Python&lt;/a&gt;：面向现代爬虫与自动化的全栈解决方案，助力高效稳定的数据抓取与网页交互。&lt;br /&gt;&lt;br /&gt;• 统一支持 HTTP 请求与无头浏览器（Playwright）模式，兼顾性能与复杂网页渲染需求。  &lt;br /&gt;• 内置代理轮换、会话管理及自动重试机制，智能避开反爬虫检测，提升爬取成功率。  &lt;br /&gt;• 采用 asyncio 异步架构，配合完整类型提示，提升开发体验与运行效率。  &lt;br /&gt;• 灵活请求路由与持久化队列，支持多任务并行与断点续爬，节省运维成本。  &lt;br /&gt;• 多样化数据存储方案，支持结构化数据与文件下载（HTML/PDF/JPG/PNG等），满足多场景需求。  &lt;br /&gt;• 兼容 BeautifulSoup 解析与 Playwright 浏览器自动化，适应从静态页面到动态内容的全方位抓取。  &lt;br /&gt;• 轻松集成至 Apify 云平台，扩展云端自动化爬虫能力，适用研究、AI训练数据采集、RAG知识库构建等。  &lt;br /&gt;&lt;br /&gt;Crawlee 提供了从入门到进阶的示例教程，帮助开发者快速构建符合项目需求的定制化爬虫系统，专注于方法论的完善和爬取流程的稳定性。其设计理念体现了现代爬虫的核心要素：高效、稳定、可扩展与易维护。&lt;br /&gt;&lt;a href=&quot;/search/%23%E8%B5%84%E6%BA%90%E5%8F%82%E8%80%83&quot;&gt;#资源参考&lt;/a&gt; &lt;a href=&quot;/search/%23Crawlee&quot;&gt;#Crawlee&lt;/a&gt; &lt;a href=&quot;/search/%23%E7%88%AC%E8%99%AB&quot;&gt;#爬虫&lt;/a&gt; &lt;a href=&quot;/search/%23python&quot;&gt;#python&lt;/a&gt;&lt;a href=&quot;https://github.com/apify/crawlee-python&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;GitHub&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;GitHub - apify/crawlee-python: Crawlee—A web scraping and browser automation library for Python to build reliable crawlers. Extract…&quot; src=&quot;/static/https://cdn4.telesco.pe/file/MJqBRpIrVWmtA996Ke5l5J69gh-pXhZ1wH5jLRxcgmM8Fl4lCEcEgQ_XvF8jSQ2C47tFhUdkqzynaLOms5gBoT3y84o_zi99PTJiWMYfPl1bBJzRLes0G8N3qNEQb5faUSf_DmJq5OWQuOY8bx6a_hNhp9hnopXqWoKG1MGKCWixcyL6zTC_FuntRjlz3VzSdvxUTnfg-2N7ZRVJYr4YGRftNHNqVi2miW_nDoiaQBDD-qoCH3SAp9yyyBjop_5frdoOQxPwYLTi8FN21XlfH_vwoD2eFAOLaFy-LQWiSnHQZkEhE1_Oy1MhebBqIn4BPMyQ1MeexdIZEk5-Ul4Jhg.jpg&quot; loading=&quot;lazy&quot; /&gt;
  &lt;div&gt;GitHub - apify/crawlee-python: Crawlee—A web scraping and browser automation library for Python to build reliable crawlers. Extract…&lt;/div&gt;
  &lt;div&gt;Crawlee—A web scraping and browser automation library for Python to build reliable crawlers. Extract data for AI, LLMs, RAG, or GPTs. Download HTML, PDF, JPG, PNG, and other files from websites. Wo...&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>#GitHub #爬虫 #列表👩‍💻 Python - 实用 Python 脚本合集列表▎项目功能：Python 脚本列表▎项目介绍：一个收集多个实用 Python 脚本的项目，涵盖文件处理、数据分析、自动化、游戏开发等领域</title><link>https://cc.nostses.icu/posts/216</link><guid isPermaLink="true">https://cc.nostses.icu/posts/216</guid><pubDate>Mon, 11 Nov 2024 12:19:42 GMT</pubDate><content:encoded>&lt;div&gt;
      
        &lt;img src=&quot;/static/https://cdn5.telesco.pe/file/pbVGMZNJU5PloARtBODorkm8ZajfBoDhPguhd-CZqUqB5ZVerDJJairtlIGK59ip6At81ozrlRkgP4b09AG6CPnO3oS0IBMtQCKozsXruqSZPze8UtZUnNlFC8HJGD19XTWVTCJOQnEamQxG_4XNVfMyPvkgQPOw7uXkFNhaNYZLcQf3bZWjBM4akIHCKj8hzuXsrYxlMzTSiCXLNtrTkTtNDELDZH2RTqCvrTUIvc9qtXeMYVdaAYzfAwzGBY2ljgVJRxXq6JgijUx-eSFX61_s-cIhlmVh8gCaq8gFpN_aP4gHH1FnrH1TGEViU2JjTkkFzEVs5MEoR4lnOT9GzQ.jpg&quot; alt=&quot;#GitHub #爬虫 #列表👩‍💻 Python - 实用 Python 脚本合集列表▎项目功能：Python 脚本列表▎项目介绍：一个收集多个实用 Python 脚本的项目，涵盖文件处理、数据分析、自动化、游戏开发等领域&quot; loading=&quot;lazy&quot; /&gt;
      
      
        
      
    &lt;/div&gt;&lt;a href=&quot;/search/%23GitHub&quot;&gt;&lt;b&gt;#GitHub&lt;/b&gt;&lt;/a&gt;&lt;b&gt; &lt;/b&gt;&lt;a href=&quot;/search/%23%E7%88%AC%E8%99%AB&quot;&gt;&lt;b&gt;#爬虫&lt;/b&gt;&lt;/a&gt;&lt;b&gt; &lt;/b&gt;&lt;a href=&quot;/search/%23%E5%88%97%E8%A1%A8&quot;&gt;&lt;b&gt;#列表&lt;/b&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;👩‍💻&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://github.com/geekcomputers/Python&quot; target=&quot;_blank&quot;&gt;&lt;b&gt;Python - 实用 Python 脚本合集列表&lt;/b&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;▎项目功能：&lt;b&gt;Python 脚本列表&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;▎项目介绍：一个收集多个实用 Python 脚本的项目，涵盖文件处理、数据分析、自动化、游戏开发等领域。&lt;br /&gt;&lt;br /&gt;每个脚本都有清晰的说明和代码示例，用户可以根据需求自定义和应用这些代码。&lt;br /&gt;&lt;br /&gt;如批量重命名文件、YouTube 视频下载、二维码生成器和聊天应用等。&lt;br /&gt;&lt;br /&gt;▎项目地址：&lt;a href=&quot;https://github.com/geekcomputers/Python&quot; target=&quot;_blank&quot;&gt;&lt;b&gt;点击打开&lt;/b&gt;&lt;/a&gt;</content:encoded></item></channel></rss>