UN2758
V2EX  ›  问与答

如何用 pandas 计算不同群组的留存率?

  •  
  •   UN2758 · Jun 12, 2018 · 1492 views
    This topic created in 2912 days ago, the information mentioned may be changed or developed.

    勉强会计算同一群组下的留存率,但是有了 groupid 之后就不知道如何处理了.
    这是简单的留存率
    简单的留存率
    这是数据
    TIM20180612102312.png
    我最开始的想法是按 gid 分表然后把时间重采样到天,然后按天合并相同天的记录,求注册用户和登录用户之间的交集,但是 pandas 似乎这样做不了?
    对于最后得到的留存率表的格式我也不是很清楚,希望是按[gid][date]查询这样的?

    2 replies    2018-06-12 11:00:37 +08:00
    funky
        1
    funky  
       Jun 12, 2018
    redis bitmap 了解一下?
    UN2758
        2
    UN2758  
    OP
       Jun 12, 2018
    @funky #1 最后是会使用 dask 做分布式计算,dask 继承实现了 pandas 的一些类
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   965 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 20:35 · PVG 04:35 · LAX 13:35 · JFK 16:35
    ♥ Do have faith in what you're doing.