Home
Sign Up
Sign In
V2EX
›
问与答
Linux 如何处理超大体积的文本文件?
Ryans
·
Jul 5, 2015
· 2531 views
This topic created in 3992 days ago, the information mentioned may be changed or developed.
例如,以 GB 为单位的文本文件,内容为纪录条目
1)对文件里面的条目去重,仅保留不重复的内容
2)切割文件,例如只保留最后 1/3 或 最后 1/2 体积的内容
使用uniq sort 等系统自带命令
条目
文本文件
体积
2 replies
•
2015-07-06 11:50:34 +08:00
1
msg7086
Jul 6, 2015
切割可以 head / tail。
去重需要 sort + uniq 要看内存有多大了吧。
2
tanywei
Jul 6, 2015
python yield
About
·
Help
·
Advertise
·
Blog
·
API
·
FAQ
·
Solana
·
5427 Online
Highest 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 37ms ·
UTC 08:39
·
PVG 16:39
·
LAX 01:39
·
JFK 04:39
♥ Do have faith in what you're doing.
❯