根据我自己实践过的经验总结出以下内容,我2023年6月底采集过信贷资讯内容,3天时间移动权1提升到移动权3;采集方法也是下列内容中的精准采集,
1.选好目标站,最起码要权重3或以上,有最近一周的收录10页以上。
2.要精准采集,百度site+关键词 搜索你的目标站,根据百度链接获取每篇文章的真实URL,需要用到python执行爬取内容,获取目标站文章的标题,副标题,内容,图片;通过接口导出json文件,自己的cms网站对接接口进行导入分类,排版。
2.1我之前采集到的文章未经任何修改,直接照抄照搬;需要注意的是爬虫喜新厌旧,你发布的时候一定把目标站的发布时间换成当前时间。
3.采集百度的时候可能会出现验证码等问题,自己买代理IP,遇到需要验证码的时候就自动换IP。
4.自己的cms导入之前要做的准备工作百度站长进行绑定,绑定后定期推送或者导入的时候随机推送10条,大家基本都是10条的推送配额。网站地图文件放到前台或者顶部栏子菜单。
5.我说的方法涉及到至少两种技术语言,python和php,我自己不是技术出身,之前是找技术帮我实现的,能看懂的可以去实践,没有看懂的多学学大概就明白了。方法方法目前不一定有效,2023年6月底无意间想到了这个方式,效果出乎意料的好,当时每天300多IP。
附言:你直接把目标站百度site出来采集指定关键词或者指定日期内的收录结果。百度既然能收录也给目标站权重说明百度是认可的,你照抄照搬过来也会得到百度认可。
照抄照搬不一定全部收录,最起码等于你搬的优质内容,那你想想是不是起收录和权重都较快。仅限个人观点,如有不足请大神补充指正。