1. 论坛系统升级为Xenforo,欢迎大家测试!
    排除公告

逐浪CMS4.6精彩预告之二:智能采集仙女拈花

本帖由 cswrrtttt2010-06-02 发布。版面名称:源码讨论

  1. cswrrtttt

    cswrrtttt New Member

    注册:
    2009-07-16
    帖子:
    11
    赞:
    0
    编者按:
    众人期待、群星捧月的Zoomla!逐浪CMS4.6版已经进入了严密的后期开发阶段。据了解,此次版本的更新是最近间隔时间最长的一个发布,也是2010年上半年最重要的发布里程碑。
    本着“专注核心功能、超越应用需求”的理念,Zoomla!逐浪CMS4.6版将朝更易用、易敏捷、更智能的方向发展,本期开始,我们将逐期进行预告,以展期新版的核心功能。
    所周知,卓越的Zoomla!逐浪CMS产品的定位始终是:功能性、易用性、面向开发、面向商业智能展开。给客户带来功能强大,使用简捷方便的体验始终是我们的追求。
    大家知道在Zoomla!逐浪CMS历代版本中都有信息采集功能,极大的方便了广大站长和普通用户的网页信息的采集需求。运用此功能可以很轻松的从网页上抓取文字、图片、文件等任何资源,支持从任何类型的网站采集获取您所需要的信息,如各种新闻类网站、论坛、电子商务网站、求职招聘网站等,将非结构化的信息从网页中抽取出来保存到结构化的数据库中,为我所用!
    Zoomla!逐浪CMS4.6不仅将采集功能进一步强化,更是添加了网址补算法和当前网址获取两大功能。

    在进行特殊的采集时,方便对网址进行特殊的补前、补后(如用于CPS型站点构建),还能根据用户需求获取当前采集内容页的网址参数:{geturl}。

    [​IMG]

    漂亮简捷而功能强劲的采集项目添加界面,方便的“下一步”引导操作:

    [​IMG]


    完善的内容采集设置界面:

    [​IMG]

    Zoomla!逐浪CMS4.6采集功能的主要特点:
    1.内容页采集设置——通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
    2.多线程模式——将信息进行多个线程采集,高效快捷,并且在采集过程中可以离开采集页面,采集任务也可自动完成。
    3.数据保存—— 可以通过设置入库节点或添加入库节点,将数据自动保存到关系数据库中,并且数据结构能够自动适应。
    4.采集范围限制——以根据采集的采集URL的标识来限制采集的范围。
    5.对于有账户和密码的站点,Zoomla!逐浪CMS4.6设有相对应的密码参数栏,用户通过此处可以输入用户名和密码,方便采集。
    6. 编码选择——提供GB2312 、UTF-8 、Big5三种编码进行选择,支持不同编码的网站,不放过任何网页信息。

    Zoomla!逐浪CMS4.6采集功能秉承稳定、快速、高效的原则,让用户能方便够采集任何通过浏览器看得到的信息。仙女拈花,为我所用!

    更多精彩就在即将发布的Zoomla!逐浪CMS4.6,精彩值得期待!

    PS:下期将为您带来《逐浪CMS4.6精彩预告之三:有问必答商务无忧》!
    查看此功能更新说明:http://www.zoomla.cn/updata/760.shtml
    论坛讨论:http://bbs.zoomla.cn/showtopic-6855-1.aspx###

    逐浪CMS-上海QQ群:61086292