lynnworld
V2EX  ›  问与答

大量的文本文件处理用什么语言比较好?

  •  
  •   lynnworld · Jan 27, 2015 · 8878 views
    This topic created in 4151 days ago, the information mentioned may be changed or developed.

    主要是从文本中提取信息,转换加工。。数据量挺大的,希望速度快,还要容错性高.

    Supplement 1  ·  Jan 27, 2015
    涉及到解析xml之类的东西,目前是java做的,感觉越来越乱》
    28 replies    2015-01-27 14:15:16 +08:00
    vulgur
        1
    vulgur  
       Jan 27, 2015
    人生苦短,我用Python
    lululau
        2
    lululau  
       Jan 27, 2015
    最好的文本处理工具是 Perl,没有之一
    roricon
        3
    roricon  
       Jan 27, 2015
    据说是Perl
    lingo233
        4
    lingo233  
       Jan 27, 2015
    awk?
    acgeo
        5
    acgeo  
       Jan 27, 2015
    C++搞定一切!

    C++吸星大法好!!

    C++能创造其他语言!!


    哈哈哈
    princelai
        6
    princelai  
       Jan 27, 2015
    perl,sed&awk不是专门干这个的嘛
    sleeperqp
        7
    sleeperqp  
       Jan 27, 2015
    sed或者awk把
    python也可以~~
    em70
        8
    em70  
       Jan 27, 2015 via Android
    awk效率惊人,可以用来提取,给其他语言进行二次分析
    loveuqian
        9
    loveuqian  
       Jan 27, 2015
    PHP大军还有30秒到达战场????
    lxrmido
        10
    lxrmido  
       Jan 27, 2015
    PHP是最好的语言
    tini9
        11
    tini9  
       Jan 27, 2015
    ruby就挺好
    czheo
        12
    czheo  
       Jan 27, 2015
    感觉乱不是语言的问题
    lu18887
        13
    lu18887  
       Jan 27, 2015
    楼上的不要把这帖子变成月经贴好么!
    tabris17
        14
    tabris17  
       Jan 27, 2015
    大多数支持正则的脚本都没问题,看你熟悉哪个了

    资格老点的就是perl了,但是python\ruby\php都没问题
    garfeildma
        15
    garfeildma  
       Jan 27, 2015
    xml解析可以scala啊,内建xml支持
    对ms不反感的话C#也挺好
    NeoAtlantis
        16
    NeoAtlantis  
       Jan 27, 2015
    xml解析,如果单个文件不算太大的话试试python的beautifulsoup。
    Dongdong36
        17
    Dongdong36  
       Jan 27, 2015
    1L +1
    zythum
        18
    zythum  
       Jan 27, 2015
    字符串处理效率高。无疑awk
    aa88kk
        19
    aa88kk  
       Jan 27, 2015
    数据量大,xml就别解析了, 太慢。直接正则提取。
    invite
        20
    invite  
       Jan 27, 2015
    很明显,应该用C。
    46fo
        21
    46fo  
       Jan 27, 2015 via iPhone
    c 谁用谁知道
    whoops
        22
    whoops  
       Jan 27, 2015
    sed or awk,海量数据处理时,比起perl来,速度快的不是一个数量级
    Her0
        23
    Her0  
       Jan 27, 2015
    Python, awk,sed
    yakczh
        24
    yakczh  
       Jan 27, 2015
    你提供个样本,需求结果的数据, 然后贴一下各种语言的代码,根据运行时间和代码长短,就知道哪种语言适合
    itfanr
        25
    itfanr  
       Jan 27, 2015
    python 没有之一
    Comdex
        26
    Comdex  
       Jan 27, 2015
    golang吧,运行效率可能比脚本语言好,但又容易入门
    proudzhu
        27
    proudzhu  
       Jan 27, 2015 via Android
    perl + 1
    ray1919
        28
    ray1919  
       Jan 27, 2015
    Perl为字符串而生,xml有现成包
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1175 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 88ms · UTC 23:16 · PVG 07:16 · LAX 16:16 · JFK 19:16
    ♥ Do have faith in what you're doing.