用 Python 把微博数据绘制成一颗“心”

2017 年 2 月 17 日
 lzjun

把自己发的微博爬下来,用 numpy 和 matplotlib 绘制而成图片,图片中的文字是微博中出现频率最高的词语

完整代码:https://github.com/lzjun567

创意思路:http://mp.weixin.qq.com/

5385 次点击
所在节点    Python
9 条回复
keisuu
2017 年 2 月 17 日
不明觉厉
zzcchh
2017 年 2 月 17 日
哥们,真 666
qingshi
2017 年 2 月 17 日
分词是怎么处理的?
kuntang
2017 年 2 月 17 日
@qingshi 看代码是结巴分词
lzjun
2017 年 2 月 17 日
@kuntang 是用的结巴分词,不过它的局限在在于没法处理 HTML 标签。论英文分词还是 Java 中的 Lucene 牛
newbie269
2017 年 2 月 17 日
挺有想法的
sparkssssssss
2017 年 2 月 18 日
马克下
yanzixuan
2017 年 2 月 19 日
@lzjun 为啥要处理 HTML ,用 bs4 直接 text 过滤掉啊。
mingyun
2017 年 2 月 19 日
$ python heart.py
Traceback (most recent call last):
File "heart.py", line 9, in <module>
from scipy.misc import imread
File "d:\python3\lib\site-packages\scipy\__init__.py", line 61, in <module>
from numpy._distributor_init import NUMPY_MKL # requires numpy+mkl
ImportError: cannot import name 'NUMPY_MKL'


这个怎么办?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/341280

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX