![]() |
|
首页 │ Apache │ Linux│ Java│ MySQL│ 注册│帮助 | |||
相关问题
这两天研究baidu和google的新闻摘取,觉得他们的思路应该是这样的:在页面中开始出现大段中文的地方,就是新闻开始,摘取新闻的时候把新闻内容中的html链接全部去掉,google更进一步,把两个html标记之间较短的内容也去掉,只保留大段的文字,这样基本上排版就好看很多了。
问题来了:
判断“大段”中文,大家有没有好的方法?
提问者:odeal 08-17 16:04
答复

