2024年11月如何监控同行（高手监控同行的思路）-宝宝笔记本

　　⑴知己知彼，百战不殆，做外贸，行业分析必不可少。

　　⑵同行关系一直都是一种很微妙的存在，恶意竞争，打价格战，都是一种很常见的现象。

　　⑶但其实，比同行竞争更重要的，是同行之间的价值交换。

　　⑷巧妙地从同行身上榨取信息可比一味压价，硬抢客户，高明的多得多。

　　⑸今天给大家分享一篇米友JasonLuo的优质干货。

　　⑹让客户从众多候选人中一眼相中你，就从看完这篇文章开始吧~

　　⑺怎么监控同行? 思路如下:

　　⑻● 通过产品在阿里巴巴找到同行列表● 提取改列表, 并找到其在阿里主站● 通过主站信息, 提取同行官方网站

　　⑼本文用到的工具都是免费的, 切记免费~~

　　⑽先看看采集到的结果, 多的网址, 表头分别是公司名, 官网, 阿里站网址。

　　⑾开头: 哪有同行网址?

　　⑿找到同行的网址, 再去找到他们的邮箱, 给他们群发套价格或是分析他们的网站.... 想想都美滋滋。

　　⒀那么问题来了, 哪里有同行?

　　⒁阿里：alibaba.

　　⒂哪里有同行的网址?

　　⒃阿里主站Contact联系页.

　　⒄xxx.en.alibaba./contactinfo.html

　　⒅联系页都会有公司名, 地址, 网址。

　　⒆哪里有同行的邮箱?

　　⒇按照开发客户的经验, 官网一般都会有 info, sale 和 admin 前缀邮箱的, 而且一般都是经理在管理的.。

　　⒈阿里有大把的同行, 所以有只要阿里去搜产品-找公司-收集网址-挖掘邮箱-发询价, 就可以了。

　　⒉.阿里找公司列表, 用行业的关键词去阿里搜, 就会有供应商列表出来, 最多页。

　　⒊.提取列表公司网址: 每个供应商, 都有一个阿里主站的网址,。

　　⒋类似于 xxx.en.alibabd.

　　⒌.Contact 页面提取信息:

　　⒍xxx.en.alibaba.omc/contactinfo.html

　　⒎这个就是 contact 页面, 会有如下信息:

　　⒏. 阿里公司列表

　　⒐.. 阿里找公司

　　⒑说干就干, 到阿里巴到官网, 搜索栏切换到 Suppliers, 搜关键词LED, 找出公司来。

　　⒒我是用这个关键词来演示的, 实际上关键词要跟据实际情况下设定的。

　　⒓下拉到最后面, 跳转到第二页, 先分析下这个网址。

　　⒔可以看到, 第二页的网址里面有个 page=, 试下第三页, 就是 page=, 由此可以看到, 改变这个数字, 就可以到不同的页面。

　　⒕有了这个变化规律, 就可以在采集器里批量添加网址了。

　　⒖先把这个网址保存下来。

　　⒗. 公司网址提取

　　⒘这里用到的是火车头采集器. 打开火车头采集器, 新建任务。

　　⒙这里添加网址, 向导添加。

　　⒚选择批量网址, 把刚刚的第二页的网址粘贴上去, 然后把 Page=后面的替换成地址参数。

　　⒛下面的地址参数从开始, 每次递增, 共页, 这样的话, 就一次性添加了页的阿里巴巴的产品页。

　　①每页有-家公司, 一下子也有几百了。

　　②这样软件就会一页一面地提取所有页里面的网址，阿里默认显示搜索结显示页, 如果你原意, 也可以设置为页。

　　③. 网址列表处理

　　④现在网址添加完了，软件会这个页面所有的网址都提取出来, 其中有公司主页的网址, 如下所示, 这就是我们想要的。

　　⑤这些网址都会有这样的字段：

　　⑥en.alibaba./_profile.html

　　⑦所以软件里添加过滤条件, 网址必需包含刚刚的字段，把这个字段填进链接过滤里面去。

　　⑧过滤条件弄好了, 等下采集的网址就都是同行阿里主页的网址了，因为我们要去阿里 contactinfo 页面, 所以网址还要处理下。

　　⑨先进入高级模式, 选择列表处理, 添加处理方式。

　　⑩/pany_profile.html

　　Ⅰ/contactinfo.html

　　Ⅱ这样提取出来的阿里网址：

　　Ⅲxxx.en.alibaba./pany_profile.html

　　Ⅳ经过过滤处理后都是变成了：

　　Ⅴxxx.en.alibaba./contactinfo.html

　　Ⅵ联系信息页面的网址了, 上面有就我们心心念念的网址了。

　　Ⅶ高级模式下, 有个列表处理, 把里面网址改掉。

　　Ⅷ. 添加三个标签

　　Ⅸ现在到了内容采集了，先找到一个要采集的 contact 页面, 分析页面, 并 Ctrl U 查看源代码。

　　Ⅹ标签列表, 新建三个标签, name 是采集的公司名, web 是采集公司的官网, web 是采集的阿里网址。

　　㈠. 标签设定前后前后截取

　　㈡分析源代码后, 确定我们要的内容开头字符串, 结尾字符串。

　　㈢这里需要去查看网页源代码 , 分析我们需要的数据的位置, 前面是什么字符串, 后面是什么字符串。

　　㈣三个标签数据前后截取设置分别如下图所示：

　　㈤如果是不同的任务, 或是不同的内容, 是要跟实际情况来更改的。

　　㈥测试了下, 发现, 采集的数据, 有其它乱入的东西, 不是很干净, 得处理下。

　　㈦在数据处理那, 下面有处理方式, 添加几个, 把不要的东西替换掉, 这样最后的结果就干净了。

　　㈧回到name标签里, 添加数据处理方式,。

　　㈨把 Contact Information for 替换为空。

　　㈩点击web标签, 添加数据处理方式,。

　　把 ww. 全部替换为空。

　　点击web标签, 添加数据处理方式, 把 // 替换为空。

　　再测试下看看, 哈哈, 结果干净多了。

　　保存任务, 再启动任务, 小火车呜呜呜开起来, 开始收集。

　　已经很不错了, 里有些字符再处理下, 就可以让它去运行了，有了网址, 接下来就怎么去找这些同行的邮箱了。

　　因为篇副的原因, 有很多的细节没有出写出来. 在操作的过程中, 碰到的问题, 可以留言。

　　要想清楚, 网址在 Contact 页面上, 公司列表阿里可以搜出来, 然后再反过来采集这些信息。

　　阿里公司列表页要分析出规律, 可以举一反三, 采集余下的几十页的内容。

　　网址采集也要分析规律, 去除不需要的网址。

　　数据采集要分析源代码, 用前后有字符串来定位目标信息。

　　最后要一边测试一边改动, 我也是做了很多遍的。

2024年11月如何监控同行（高手监控同行的思路）

最新文章

推荐文章