IP屬地:加州
經過2020戰戰兢兢的一年,我自己找工作這個事現在也基本塵埃落定,今天就想總結總結過去幾個月的感想,也想分享給還在掙扎的同學們一些經驗,少走點彎...
https://soulmachine.gitbooks.io/system-design/content/cn/bigdata/heavy-h...
split和operator那一塊講的不清楚,后面可以看。 Presto實現原理和美團的使用實踐 這個看最后的幾個比較。https://www....
websocket 和 http的比較http://www.ruanyifeng.com/blog/2017/05/websocket.html...
https://medium.com/@morefree7/design-a-distributed-web-crawler-f67a8ebb8...
Flink WaterMark 詳解 watermark是全局的值,但是每個operator維護一個當前的watermark,多流的時候取最小。...
db直接存經緯度,加index,然后掃描一個方塊。 整個地圖劃分成格子,然后不同地方存個格子編號,然后查詢,也可以快速找到相鄰的,問題就是不同格...
大體思路,保存下。
這個文章講的挺細致了。 不過還是有幾個可以思考的細節。 需要一個global的id 生成器,給每個url文檔生成一個doc id,放進倒排里。 ...