mysqlPipeline.py 1.1 KB

1234567891011121314151617181920212223242526272829
  1. import pymysql.cursors #引入之前安装用于连接MYSQLDB的库
  2. import datetime
  3. class MySQLPipeline(object):
  4. def __init__(self):
  5. # 创建于数据库的连接
  6. self.connect = pymysql.connect(
  7. host='10.3.14.20', # DB地址
  8. port=14062, # DB端口
  9. db='scrapySpiderTest', # DB名
  10. user='root', # DB用户名
  11. passwd='usestudio-1', # DB密码
  12. charset='utf8', # 编码方式
  13. use_unicode=True)
  14. # 通过cursor执行CRUD
  15. self.cursor = self.connect.cursor()
  16. def process_item(self, item, spider):
  17. # 第一个参数是MYSQL语句
  18. # 第二个参数分别是作者、内容、标签、当前时间
  19. self.cursor.execute(
  20. """INSERT INTO content(author, content, tag, lastUpdateTime) value (%s, %s, %s, %s)""",
  21. (item['author'], item['content'], item['tag'], datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
  22. )
  23. # 执行sql语句
  24. self.connect.commit()
  25. return item # 必须实现返回