V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
XiMing
V2EX  ›  问与答

求助,如何使用 scala 语言中的 flatMap 语句进行数据压缩呢?

  •  
  •   XiMing · May 22, 2017 · 2766 views
    This topic created in 3265 days ago, the information mentioned may be changed or developed.
    最近在学习大数据,看到一个练习题。题目如下:在 Spark-Shell 中使用 scala 语言对文件使用 flatMap 语句进行数据压缩,压缩的所有数据以空格为分隔符,压缩后对字母进行 key:Value 计数(字母为 key,出现次数为 Vlaue )。
    1 replies    2017-05-22 17:48:25 +08:00
    fdhdd
        1
    fdhdd  
       May 22, 2017
    相当于 wordcount 吧
    val f = scala.io.Source.fromFile("yourFile")
    val wordCount = f.getLines.map(_.split(" ")).flatMap(a => a).groupBy(identity).mapValues(_.length)
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2730 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 13:45 · PVG 21:45 · LAX 06:45 · JFK 09:45
    ♥ Do have faith in what you're doing.