假如我要从上市公司的财报里采集他们公司的贷款情况,但是这些公司财报风格各不相同,根本无法标记采集开始和结束,这种情况还能采集吗?
理想情况是把所有可能出现的“开始”词汇收集起来,比如“信用借贷”、“银行贷款”等等,然后收集这些词汇后面的数字,结束设定为出现非数字的就结束,没有数字就跳过,这样能做到吗?如果能,大概要多少钱?
理想情况是把所有可能出现的“开始”词汇收集起来,比如“信用借贷”、“银行贷款”等等,然后收集这些词汇后面的数字,结束设定为出现非数字的就结束,没有数字就跳过,这样能做到吗?如果能,大概要多少钱?