chuwanghui пре 6 година
родитељ
комит
262c921942
1 измењених фајлова са 3 додато и 0 уклоњено
  1. 3 0
      ApiCrawler/ApiCrawler/spiders/apispider.py

+ 3 - 0
ApiCrawler/ApiCrawler/spiders/apispider.py

@@ -57,6 +57,9 @@ class ApiSpider(scrapy.spiders.Spider):
         #获取类名为book的div中的内容
         _content=response.xpath("//div[@class='book']").xpath('string(.)')
         apiItem['content']=_content[0].extract() if _content else ""
+        #作者信息
+        _author=response.xpath("//pre[@class='authors']").xpath('string(.)')
+        apiItem['author']=_author[0].extract() if _author else ""
 
         yield apiItem