你可能常见各种网站的角落里有rss标志,点击订阅后就可以定期的获取这个网站的最新消息,不过有些网站可能就不包含这个功能,但是如果你又想要该怎么办呢?feed43就是专门干这事的。
顺带说一声我把它给抄下来了,就在导航栏上,不过功能还不稳定,亟待解决,嘛,基本上可以用了,对了再附一个安卓端的apk
这个apk是真的强啊(来源于github),为啥推荐这个呢?本来是应该用greader的,但是因为呵呵呵的原因使得greader这个工具现在是只能添加源不能自动更新源,真的是很坑的 ,其实greader本身还是很强的,可惜可惜,如果是苹果端的就用reeder吧,电脑端就很多了,而且还很稳定,我所知道的就有thunderbird、微软的邮箱、甚至游览器firefox都可以订阅

网站的主页

点击Create your own feed

第一步网站,还有编码。如果Reload正常就会显示这个页面的源代码

下面的这个可能和正则表达式有点关系,如果不是很懂可以点击它的红色问号,不会太难所以不要紧张。简单来说第一块区域global search pattern叫做全局搜索域,那它是干什么的呢?我们知道一个网页中是有很多模块组成的,新闻占一个模块,图片占一个模块,评论还有类似的一些其他模块都不是我们最关注的东西,所以我们第一步,就是要选中一个网页中你最关注的那个模块,怎么找呢?右键->查看元素->点击新闻的那个地方,然后去找它的父标签,直到找到它整个模块部分,则那个标签就是你所关心的模块

那个叫做<div class="hotnews" alog-group="focustop-hotnews">就是我们要找的部分,既然有头就要有尾,

</div>就是它的结尾部分

好,现在我们把刚才得到的头和尾写进那个网站里,如下图,遇到个新东西{%},这个是表示内容的主体,也就是新闻部分,下面那个框我们先不管直接用{%}来填充。

得到以下的结果,可以左右拖动看一下是不是得到了你想要的东西。

那么接下来就是最重要的部分了,我们要把这个新闻区域每个新闻的标题连接给得到(有些博客还会有缩略内容,不过不要紧,只要这个简单的例子会了其他也就很简单了)

我们发现这个新闻区域中有很多的li标签,鼠标放上去后发现每个li代表一条新闻,这个时候我们如下操作

然后找一个记事本粘贴进去,划红线部分是我们关注的东西,其他部分怎么办?需要用{*}来代替,但也不能全部代替,标签要留下,但是标签中变的内容不能留,这里就会有人晕了,什么叫变的内容不能留,
我们这里只复制了一条新闻,如果你的pattern(正则表达式)出现了可变的内容,那就只能找到符合这条信息的内容
打个比方:
我们有两条新闻
<div id="123">你好这是主体</div>
<div id="456">你好这是主体</div>
我们要获取的是你好这是主体
那怎么写?是这么写吗?<div id="123">{%}</div>
这会导致一个问题你只能抓到第一条新闻,第二条你就抓不到了,因为标签中id是个可变内容
正确的写法是<div{*}>{%}</div>
下面这个文件也是一样,什么是可变的?我们可以再复制一条新闻来对比一下就知道了

首先class就是一个可变内容,之后还有一个mon不是每条新闻都有的,知道这些就可以开始写了

最后删删减减就剩下这些了,
<li{*}>{*}<a href="{%}"{*}>{%}</a>
你可能觉得我没按照规矩来,其实很多都是没什么必要的东西,就比如
<i class="dot">
什么<strong>
什么target=......class=......
直接用{*}一笔带过,主要东西用{%}代替
点击extract得到我们要的结果

看到这里可以说是很爽了
下面就只有一小步了,rss feed properties你可以不用去管了,然后就是rss item properties,啥意思呢?就是把刚才生成的东西填到这里来item title(标题)就是{%2} item link template(链接)就是{%1},简要没有所以不用填,其实像wordpress这样的站点标题、图片、简要、链接都有的,那在item content template这个地方是可以填入你刚才抓的图片链接进去的,这样你的rss会显得更加丰富点

点击preview,恩,东西已经全出来了,step4还附了两个文件,一个是用来发布的,这个谁都可以访问,还一个是给你用来修改的

链接就放在这里了,可以点击看效果
http://feed43.com/3663768716845171.xml

