• 请不要在回答技术问题时复制粘贴 AI 生成的内容
diveIntoWork
V2EX  ›  程序员

如何获取 spark 中作业访问了哪些数据?

  •  
  •   diveIntoWork · Jul 25, 2017 · 1828 views
    This topic created in 3224 days ago, the information mentioned may be changed or developed.

    在 spark 的 web UI 中没有找到相关信息,rest api 里也没有这一项。 需要记录 spark 的访问文件对象,包括 hdfs 文件和 linux 文件。。。 求大神指教

    1 replies    2017-07-26 07:51:39 +08:00
    mingweili0x
        1
    mingweili0x  
       Jul 26, 2017
    系统的文件可以用 lsof 监听,但 hdfs 的就不知道了。hdfs 不是典型的文件系统,只是个抽象而已,直觉告诉我他们根本没提供这个功能,或者提供了,在古老的 Hadoop Java API 里隐藏的很深,可以找找看
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2916 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 06:34 · PVG 14:34 · LAX 23:34 · JFK 02:34
    ♥ Do have faith in what you're doing.