做了个在线中文简历解析

2015 年 11 月 20 日
 arcadia
http://youyun.com
自比业内第一,欢迎大家指正!
6871 次点击
所在节点    分享创造
14 条回复
996635
2015 年 11 月 20 日
关于 HTML 解析这一块,你是怎么处理的? 重渲染么?
arcadia
2015 年 11 月 20 日
@996635 不解析 HTML 代码,去掉之后按纯文本统一处理
arcadia
2015 年 11 月 20 日

刚刚搞明白怎么贴图
kevin1452
2015 年 11 月 20 日
- -这个......
接收到足够多的简历人看不过来的估计都有自己的挖掘系统
小公司估计 hr 可以 hold 住

我就一说..
easychen
2015 年 11 月 20 日
顺便找了份简历测试了下,效果一般。有两段工作经历没有切开。

如果扔掉结构分析纯文本的话,主要就看字段规则库和行业词库。加上自学习基本能帮人做第一遍分析。
我们之前有个分析 dom 树来算区块文字权重的算法,效果还不错。 后来发现实际业务基本用不到这个功能就没改进了……
finian
2015 年 11 月 20 日
围观域名
chenyr99
2015 年 11 月 20 日
试了几个,还行。
powtop
2015 年 11 月 20 日
这域名 可以
unknownservice
2015 年 11 月 20 日
拿手边的一份试了一下, 21 个字段只解析出 6 个...
tequila713
2015 年 11 月 22 日
@arcadia 噗 楼主是 didit 哪位?
hqs123
2015 年 11 月 23 日
不错,支持分享
arcadia
2015 年 11 月 23 日
@kevin1452 是的,如果简历多,并且源头比较固定,可以开发自己的挖掘系统。但是当简历的来源比较多的适合,简历的格式比较复杂适合,开发自己的挖掘系统就不是很划算了。
arcadia
2015 年 11 月 23 日
@unknownservice 现在,解析的内容是大部分简历中常见的信息,并且这些字段对评价简历的质量比较重要,会有部分内容现在不支持解析,欢迎提供意见
kandy
2018 年 9 月 18 日
差距很明显呀

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/237572

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX