最近 全棧數(shù)據(jù)工程師養(yǎng)成攻略
的微信群已經(jīng)將近500人,開了二群之后為了打通不同微信群之間的消息,花了點時間做了個消息同步機器人,在任意群收到消息時同步到其他群,并且將聊天內(nèi)容上傳至數(shù)據(jù)庫,以供進一步分析、統(tǒng)計和展示。
基本思路是,用 Python
模擬微信網(wǎng)頁版登陸,接收到群里消息后,對文本、圖片、分享等各類消息類型分別處理,并轉(zhuǎn)發(fā)至其他群。
前期準備
首先得有一個微信號,用于代碼模擬登陸。由于我的微信號得自己留著用,現(xiàn)階段注冊微信又必須要手機號,于是只好特意辦了個電信號,用來申請了一個新的微信,微信號是 honlanbot
。雖說似乎可以用阿里小號來注冊微信,不過聽說存在反復(fù)回收和安全隱患問題,故不采用。
其次,需要用到一個Python庫 itchat
,這個庫已經(jīng)做好了用代碼調(diào)用微信的大多數(shù)功能,非常好用,官方文檔在這里,安裝的時候使用 pip
即可。
pip install itchat
我的手機支持雙卡雙待,于是把兩張卡都裝手機里,再雙開微信,同時保持兩個微信號手機在線,差不多就可以開始寫代碼了。用 itchat
調(diào)用微信主要是模擬微信網(wǎng)頁版登陸,所以必須保持微信號手機在線,因為手機端微信一旦退出,其在網(wǎng)頁、PC、MAC、IPAD等相應(yīng)終端認證的賬號也會隨之退出。
初步嘗試
itchat
提供了一些官方代碼,讓我們在自己的本本或電腦上新建一個 py
文件,初步嘗試一下。
運行以下代碼,會出現(xiàn)出現(xiàn)一張二維碼,掃碼登陸之后將會給“文件傳輸助手”發(fā)送一條消息。
# 加載包
import itchat
# 登陸
itchat.auto_login()
# 發(fā)送文本消息,發(fā)送目標是“文件傳輸助手”
itchat.send('Hello, filehelper', toUserName='filehelper')
以下代碼則注冊了一個消息響應(yīng)事件,用來定義接收到文本消息后如何處理。在 itchat
里可以定義文本、圖片、名片、位置、通知、分享、文件等多種消息類型,從而分別執(zhí)行不同的處理。
import itchat
# 注冊消息響應(yīng)事件,消息類型為itchat.content.TEXT,即文本消息
@itchat.msg_register(itchat.content.TEXT)
def text_reply(msg):
# 返回同樣的文本消息
return msg['Text']
itchat.auto_login()
# 綁定消息響應(yīng)事件后,讓itchat運行起來,監(jiān)聽消息
itchat.run()
再來看看如何處理其他類型消息,可以把在消息響應(yīng)事件里把 msg
打印出來,是一個字典,看看有哪些感興趣的字段。
import itchat
# import全部消息類型
from itchat.content import *
# 處理文本類消息
# 包括文本、位置、名片、通知、分享
@itchat.msg_register([TEXT, MAP, CARD, NOTE, SHARING])
def text_reply(msg):
# 微信里,每個用戶和群聊,都使用很長的ID來區(qū)分
# msg['FromUserName']就是發(fā)送者的ID
# 將消息的類型和文本內(nèi)容返回給發(fā)送者
itchat.send('%s: %s' % (msg['Type'], msg['Text']), msg['FromUserName'])
# 處理多媒體類消息
# 包括圖片、錄音、文件、視頻
@itchat.msg_register([PICTURE, RECORDING, ATTACHMENT, VIDEO])
def download_files(msg):
# msg['Text']是一個文件下載函數(shù)
# 傳入文件名,將文件下載下來
msg['Text'](msg['FileName'])
# 把下載好的文件再發(fā)回給發(fā)送者
return '@%s@%s' % ({'Picture': 'img', 'Video': 'vid'}.get(msg['Type'], 'fil'), msg['FileName'])
# 處理好友添加請求
@itchat.msg_register(FRIENDS)
def add_friend(msg):
# 該操作會自動將新好友的消息錄入,不需要重載通訊錄
itchat.add_friend(**msg['Text'])
# 加完好友后,給好友打個招呼
itchat.send_msg('Nice to meet you!', msg['RecommendInfo']['UserName'])
# 處理群聊消息
@itchat.msg_register(TEXT, isGroupChat=True)
def text_reply(msg):
if msg['isAt']:
itchat.send(u'@%s\u2005I received: %s' % (msg['ActualNickName'], msg['Content']), msg['FromUserName'])
# 在auto_login()里面提供一個True,即hotReload=True
# 即可保留登陸狀態(tài)
# 即使程序關(guān)閉,一定時間內(nèi)重新開啟也可以不用重新掃碼
itchat.auto_login(True)
itchat.run()
開發(fā)消息同步機器人
經(jīng)過以上示例代碼,可以總結(jié)出消息同步機器人的開發(fā)思路:
- 登陸后使用
get_chatrooms()
獲取全部群聊的數(shù)據(jù),包括每個群聊的ID和昵稱,可以將需要同步消息的群聊保存至通訊錄; - 接收到群聊消息時,如果消息來自于需要同步消息的群聊,就根據(jù)消息類型進行處理,同時轉(zhuǎn)發(fā)到其他需要同步的群聊。
直接上代碼好了,首先定義一個消息響應(yīng)函數(shù),文本類消息我感興趣的是 TEXT
和 SHARING
兩類,使用 isGroupChat=True
指定消息來自于群聊,這個參數(shù)默認為 False
。
# 自動回復(fù)文本等類別的群聊消息
# isGroupChat=True表示為群聊消息
@itchat.msg_register([TEXT, SHARING], isGroupChat=True)
def group_reply_text(msg):
# 消息來自于哪個群聊
chatroom_id = msg['FromUserName']
# 發(fā)送者的昵稱
username = msg['ActualNickName']
# 消息并不是來自于需要同步的群
if not chatroom_id in chatroom_ids:
return
if msg['Type'] == TEXT:
content = msg['Content']
elif msg['Type'] == SHARING:
content = msg['Text']
# 根據(jù)消息類型轉(zhuǎn)發(fā)至其他群
if msg['Type'] == TEXT:
for item in chatrooms:
if not item['UserName'] == chatroom_id:
itchat.send('%s\n%s' % (username, msg['Content']), item['UserName'])
elif msg['Type'] == SHARING:
for item in chatrooms:
if not item['UserName'] == chatroom_id:
itchat.send('%s\n%s\n%s' % (username, msg['Text'], msg['Url']), item['UserName'])
再來處理下圖片等多媒體類消息。
# 自動回復(fù)圖片等類別的群聊消息
# isGroupChat=True表示為群聊消息
@itchat.msg_register([PICTURE, ATTACHMENT, VIDEO], isGroupChat=True)
def group_reply_media(msg):
# 消息來自于哪個群聊
chatroom_id = msg['FromUserName']
# 發(fā)送者的昵稱
username = msg['ActualNickName']
# 消息并不是來自于需要同步的群
if not chatroom_id in chatroom_ids:
return
# 如果為gif圖片則不轉(zhuǎn)發(fā)
if msg['FileName'][-4:] == '.gif':
return
# 下載圖片等文件
msg['Text'](msg['FileName'])
# 轉(zhuǎn)發(fā)至其他需要同步消息的群聊
for item in chatrooms:
if not item['UserName'] == chatroom_id:
itchat.send('@%s@%s' % ({'Picture': 'img', 'Video': 'vid'}.get(msg['Type'], 'fil'), msg['FileName']), item['UserName'])
以上代碼實現(xiàn)了對文本、分享、圖片、視頻四類消息的處理,如果對其他類型的消息也感興趣,進行相應(yīng)的處理即可。在前面補上 import
的代碼,在后面補上登陸、獲取群聊數(shù)據(jù)和開始監(jiān)測的代碼,就大功告成了。
完整代碼在這里:https://pan.baidu.com/s/1bpAJk0B
成果展示
目前兩個群之間可以進行消息同步了,一群和二群的小伙伴終于可以暢快地聊了起來(當群主不容易,經(jīng)常要發(fā)很多紅包 = =)。
進一步工作
當然,我不可能一直在筆記本上運行這么個 py
代碼,所以把它部署到服務(wù)器上運行就好了,開個 screen
或者用 IPython
都可以。如果賬號偶爾下線了,再運行一下就好。
另外,我還寫了個 API
,響應(yīng)消息的時候會把相應(yīng)的數(shù)據(jù) POST
到我的服務(wù)器并存到數(shù)據(jù)庫,以供進一步的分析、統(tǒng)計和展示,這也是我身為一個群主應(yīng)盡的職責~