用 Python 把微博数据绘制成一颗“心”

2017 年 2 月 17 日

lzjun

把自己发的微博爬下来，用 numpy 和 matplotlib 绘制而成图片，图片中的文字是微博中出现频率最高的词语

完整代码：https://github.com/lzjun567

创意思路：http://mp.weixin.qq.com/

5482 次点击

所在节点

Python

9 条回复

keisuu

2017 年 2 月 17 日

不明觉厉

zzcchh

2017 年 2 月 17 日

哥们，真 666

qingshi

2017 年 2 月 17 日

分词是怎么处理的？

kuntang

2017 年 2 月 17 日

@qingshi 看代码是结巴分词

lzjun

2017 年 2 月 17 日

@kuntang 是用的结巴分词，不过它的局限在在于没法处理 HTML 标签。论英文分词还是 Java 中的 Lucene 牛

newbie269

2017 年 2 月 17 日

挺有想法的

sparkssssssss

2017 年 2 月 18 日

马克下

yanzixuan

2017 年 2 月 19 日

@lzjun 为啥要处理 HTML ，用 bs4 直接 text 过滤掉啊。

mingyun

2017 年 2 月 19 日

$ python heart.py
Traceback (most recent call last):
File "heart.py", line 9, in <module>
from scipy.misc import imread
File "d:\python3\lib\site-packages\scipy\__init__.py", line 61, in <module>
from numpy._distributor_init import NUMPY_MKL # requires numpy+mkl
ImportError: cannot import name 'NUMPY_MKL'

这个怎么办？

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/341280

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.