如何来区分是我写的还是我转载的,
2012-05-01 17:00
309 查看
我的博客中以转载为主,转载中偶带评论或是纯小段的个人的microblogging,导致要我自己写的那些还挺难找
小毛这厮的思路是:
写一个程序,来统计所有文章的长度,一般小于平均值的都是我写的,这个概率很大,
我基本上以写微博的方式来写博客。
剩下比较难办的是如何把剩下小部分较长的文章从众多的转载中找了出来,
对于外链特别多的,一般也不是我写的,这个也可以作为一个特征
另外的自己写的一般离散度比较大,生活技术夹杂,中英chineseenginlish夹杂,估计得用点nlp这个难度有点。。。
还有别的方式就要请牛人指点了
小毛这厮的思路是:
写一个程序,来统计所有文章的长度,一般小于平均值的都是我写的,这个概率很大,
我基本上以写微博的方式来写博客。
剩下比较难办的是如何把剩下小部分较长的文章从众多的转载中找了出来,
对于外链特别多的,一般也不是我写的,这个也可以作为一个特征
另外的自己写的一般离散度比较大,生活技术夹杂,中英chineseenginlish夹杂,估计得用点nlp这个难度有点。。。
还有别的方式就要请牛人指点了
相关文章推荐
- 如何区分一个程序员是“老手“还是“新手“?(转载)
- 转载:如何区分空间参考、坐标系统、投影、基准面和椭圆体?
- 在ARM汇编中如何区分LDR是指令还是伪指令
- [转载]ASP.NET Web 服务还是 .NET Remoting:如何选择,使用 Microsoft .NET 建立分布式应用程序
- 如何区分一个.lib文件是静态库还是动态库导出的文件
- Windows内核开发中如何区分文件对象究竟是文件还是文件夹?(FILE_OBJECT包括了无数详细信息)
- 如何在读文件的时候区分中文还是英文
- 如何区分android中页面使用原生还是html5?
- 如何判断request是同步还是异步(转载)
- 如何区分大盘股还是小盘股|定义
- CTO专访:坚守还是追新,开发者如何应对新技术暗潮(转载的文章)
- 如何区分一个程序员是“老手“还是“新手“?
- Java如何区分手机端还是电脑端访问
- 如何区分当前设备是 Protect PC 还是 Protect PC Phone
- 【转载】JPush Android 推送如何区分开发、生产环境
- 如何区分一个程序员是“老手“还是“新手“?
- 如何区分 使用的是手机还是平板? 续
- 如何区分一个程序员是“老手“还是“新手“?
- CPU如何区分读出的代码是指令还是数据
- 指令和数据都用二进制代码存放在内存中,从时空观角度回答CPU如何区分读出的代码是指令还是数据