EPr2hh6LADQWqRVH

我感觉 ES 要火了?大家都用的什么版本啊,什么分词器啊,交流一下?

  •  
  •   EPr2hh6LADQWqRVH · May 24, 2015 · 11321 views
    This topic created in 4009 days ago, the information mentioned may be changed or developed.

    我这里是官网下的es1.5.2, 再加上IK 分词器, 插件经过了略微修改才能正常使用的。。
    大家呢。。
    不会都直接用了某大神的-rtf版本吧。。。

    同时求比ik更靠谱的分词器

    26 replies    2015-05-26 12:24:21 +08:00
    RemRain
        1
    RemRain  
       May 25, 2015
    直接用的最新版,搭配 sun 的 jre/jdk7 来跑,openjdk 貌似存在问题。

    另外不建议在生产环境用 rtf,一是版本老旧,二是运行一段时间后,就会变得非常慢
    ansel
        2
    ansel  
       May 25, 2015
    不稳定,不明原因缓慢无数据,后悔商用了。。。
    karloku
        3
    karloku  
       May 25, 2015 via iPad
    1.5.2+ik+从搜狗爬的四百万条词库...
    i33
        4
    i33  
       May 25, 2015
    跳刀大是很NB,我用的6.83
    pH
        5
    pH  
       May 25, 2015
    分词器?中文的?
    gkiwi
        6
    gkiwi  
       May 25, 2015
    中文分词器也就ik吧,其他没听说过。
    话说安全性你解决了没?端口还开这么?授权加了没?版本兼容性解决了么?
    EPr2hh6LADQWqRVH
        7
    EPr2hh6LADQWqRVH  
    OP
       May 25, 2015
    @gkiwi 蛤,什么版本兼容性。。。
    安全性全依赖防火墙了,感觉足够了,不需要装插件了
    EPr2hh6LADQWqRVH
        8
    EPr2hh6LADQWqRVH  
    OP
       May 25, 2015
    @pH 是的啊
    withrock
        9
    withrock  
       May 25, 2015
    zhicheng
        10
    zhicheng  
       May 25, 2015 via Android
    那我还感觉 iPhone 要火了呢。
    觉得 ElasticSearch 慢的,注意把 Marvel 这个插件禁掉。。。。
    pH
        11
    pH  
       May 25, 2015
    为啥分词器要火?
    karloku
        12
    karloku  
       May 25, 2015
    @pH ES是基于lucene的搜索引擎, 分词器说的基于ik, mmseg, jieba这些中文分词工具做的ES插件
    hxtheone
        13
    hxtheone  
       May 25, 2015
    @i33 一刀牛表示不服→_→
    874808862
        14
    874808862  
       May 25, 2015 via iPhone
    ES是什么?分词器又是什么?求解,别打我
    sengxian
        15
    sengxian  
       May 25, 2015
    http://www.oschina.net/p/freeictclas 中科院中文分词,牛的很
    jyootai
        16
    jyootai  
       May 25, 2015
    ES是什么?ECMAScript ?
    EPr2hh6LADQWqRVH
        17
    EPr2hh6LADQWqRVH  
    OP
       May 25, 2015
    @sengxian hmmm,确实,光从代码量的角度看ik和ictcals就完全不在一个量级上。。
    zts1993
        18
    zts1993  
       May 25, 2015   ❤️ 1
    试试ansj?不知道有没有支持es
    EPr2hh6LADQWqRVH
        19
    EPr2hh6LADQWqRVH  
    OP
       May 25, 2015
    @zts1993 目测很靠谱
    garyLin
        20
    garyLin  
       May 25, 2015
    =。= 以为是ECMAScript
    pH
        21
    pH  
       May 25, 2015
    @karloku 另外借问下,有木有好的英文分词,推荐一个吧?
    hactrox
        22
    hactrox  
       May 25, 2015
    @jyootai ES -> ElasticSearch
    13k
        23
    13k  
       May 25, 2015
    @pH 英文不都是空格分的么
    pH
        24
    pH  
       May 25, 2015
    @13k 应该说是统计词频的。
    13k
        25
    13k  
       May 25, 2015
    @pH 这个不是应该看你什么环境么?
    Excel的透视表
    SQL的count group by
    Python和R的就更多选择了
    elyamen
        26
    elyamen  
       May 26, 2015
    ES 分词开源,能直接用到外国的程序上,支持中文搜索吗?比如esotakl?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2787 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 65ms · UTC 10:35 · PVG 18:35 · LAX 03:35 · JFK 06:35
    ♥ Do have faith in what you're doing.