提交

b2cfca39 · jimmy · cd864674 · b2cfca39 · b2cfca39 · b2cfca39
Commit b2cfca39 authored Aug 30, 2023 by jimmy
Showing with 4 additions and 6 deletions

crawler.cpython-311.pyc __pycache__/crawler.cpython-311.pyc +0 -0

crawler.py crawler.py +0 -2

crawler_baidu.py crawler_baidu.py +2 -2

crawler_boss.py crawler_boss.py +2 -2

No files found.
--- a/__pycache__/crawler.cpython-311.pyc
+++ b/__pycache__/crawler.cpython-311.pyc
--- a/crawler.py
+++ b/crawler.py
@@ -11,8 +11,6 @@ import cyaml
 #获取需要爬数据的企业 百度1
 def GetCompany(types):
    response = requests.get(cyaml.data[cyaml.data["env"]]["url"]+cyaml.data["php-api"]["getcompany"]+"?type="+str(types), headers={"Content-Type": "application/json"})
-    print(response)
-    print(cyaml.data[cyaml.data["env"]]["url"]+cyaml.data["php-api"]["getcompany"]+"?type="+str(types))
    if response.status_code == 200:
        response_data = response.json()
        # if response_data.get('name') is not None:

--- a/crawler_baidu.py
+++ b/crawler_baidu.py
@@ -2,7 +2,7 @@ from playwright.sync_api import Playwright, sync_playwright, expect

 import re
 import json
-import datetime
+import cyaml
 import crawler

 #爬虫启动
@@ -12,7 +12,7 @@ def CrawlerBaidu():

 #爬取百度的数据
 def GetBaiduCompany(playwright: Playwright) -> int:
-    browser = playwright.chromium.launch(headless=False)
+    browser = playwright.chromium.launch(headless=cyaml.data[cyaml.data["env"]]["headless"])
    context = browser.new_context(viewport={"width": 800, "height": 600})
    page = context.new_page()
    #获取需要爬取数据的公司

--- a/crawler_boss.py
+++ b/crawler_boss.py
@@ -2,7 +2,7 @@ import crawler
 import requests
 from playwright.sync_api import Playwright, sync_playwright
 import json
-
+import cyaml

 def spider_company(page):
    company_nameO, url = crawler.GetCompany(2)
@@ -37,7 +37,7 @@ def spider_company(page):


 def GetBossCompany(p: Playwright) -> None:
-    browser = p.chromium.launch(headless=False)
+    browser = p.chromium.launch(headless=cyaml.data[cyaml.data["env"]]["headless"])
    context = browser.new_context(viewport={"width": 800, "height": 600})
    js = """
    Object.defineProperties(navigator, {webdriver:{get:()=>undefined}});