V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
a54425415
V2EX  ›  程序员

懂采集,爬虫的大佬 求指点下小弟

  •  
  •   a54425415 · Oct 22, 2017 · 3835 views
    This topic created in 3113 days ago, the information mentioned may be changed or developed.

    根据自动采集关键词且自动采集相对应的文章,入库 呈现出来
    这种最简单的用啥语言造个轮子 有懂得大佬 指点下

    目测有个类似的系统 http://www.zhuantiyi.com

    专题易

    收费的 买不起 只能自造了

    12 replies    2017-12-07 06:11:16 +08:00
    ila
        1
    ila  
       Oct 22, 2017 via iPhone
    欢迎进入 scrapy 副本,请注意,敌人还有五分钟到达战场
    a54425415
        2
    a54425415  
    OP
       Oct 22, 2017 via Android
    @ila 昨天看了一圈 php Python java 感觉都好困难,
    可能没有现成的例子观摩吧 ,自用的 bt 爬虫是 Python 改成了一键傻瓜式安装 自动定时重启爬虫 就觉得很简单了,


    这种 新闻类似的 头一次 可能没掌握技巧吧 路漫漫其修远兮啊
    可能比较倾向于一键傻瓜式吧
    ila
        3
    ila  
       Oct 22, 2017 via iPhone
    知道一个道理,免费的最贵
    傻瓜的手尾最长
    a54425415
        4
    a54425415  
    OP
       Oct 22, 2017 via Android
    @ila 重来没想过 免费获取 免费才是最贵的 花钱买现成的跟花钱重头写 两个概念 意义不一样 啊哟思单
    lhx2008
        5
    lhx2008  
       Oct 22, 2017
    要么省成本要么省时间,省成本还要自己有技术,自己选吧
    golmic
        6
    golmic  
       Oct 22, 2017 via Android
    我可以付费帮你做一个
    schoolers
        7
    schoolers  
       Oct 22, 2017
    可以联系我啊
    ila
        8
    ila  
       Oct 22, 2017 via Android
    把要采集的网站发上来看看?
    shuizhengqi
        9
    shuizhengqi  
       Oct 22, 2017
    给钱办事
    woscaizi
        10
    woscaizi  
       Oct 25, 2017 via iPhone
    Java webmagic,不到一分钟搭好环境。
    cangbaotu
        11
    cangbaotu  
       Nov 2, 2017
    不重复造轮子 现在要开发爬虫都用神箭手了
    a54425415
        12
    a54425415  
    OP
       Dec 7, 2017
    这种事基于根据百度或者 gg 搜索相关关键词采集文章的
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   940 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 52ms · UTC 22:50 · PVG 06:50 · LAX 15:50 · JFK 18:50
    ♥ Do have faith in what you're doing.