文章编号:1673-1417(2018)01-0082-06 doi:10.13908/j.cnki.issn1673-1417.2018.01.0018
电商营销精确搜索引擎的优化设计与实现
李建元
(漳州职业技术学院,福建 漳州 363000)
摘 要:当前,电子商务折扣网站存在先天的局限性,越来越跟不上时代发展的要求。开发一个可以精确搜索网络折扣信息的搜索引擎,成为电商营销领域关切的问题。遵循精确搜索引擎的基本框架,综合使用文档解析算法、信息提取算法、规则匹配算法以及相关文档的生成算法进行优化设计,建构了电子商务营销领域精确搜索引擎的应用模型。实验表明,这个应用模型具备获取较为准确和全面的折扣信息的能力,并具有良好的精度和响应速度。
关键词:电子商务营销;精确搜索引擎;优化设计;实现路径 中图分类号: TP391.3 文献标识码: A
在快速发展和普及网络科技的今天,各式各样的营销模式纷纷出现,电子商务销售就是最具代表性且运用最为广泛的网络销售模式之一。电子商务网站销售的促销给消费者带来了各种形式实惠和便利。但是,网络营销网站有一定局限性,比如为用户提供具有时效性、精准度的各种折扣信息的能力不足,通过网站的搜索引擎到结果的用户并不是都能够准确找到想要的、有针对性的打折信息。如果网络营销折扣网站从用户的角度进行设计,利用Web数据来挖掘并提供个性化信息检索等技术支持支持这些网站的折扣信息搜索,同时通过基于ISML标记语言,经过Web内容挖掘,再把所有互联网上的网页被转换成HTLM语言格式,便使得基于电子商务ISML标记语言格式缩小搜索范围同时更加个性化。因此,对于电子商务网站销售活动提供及时、准确的折扣信息,有很大的应用价值和现实意义。
一、当前主流的应用搜索引擎技术的现况分析
(一)电子商务营销技术性分析
技术性是网络销售平台被外部环境支持的程度,其中包括电商企业、技术服务平台、供应链环境、消费者意识、计算机操作能力和消费习惯能否有力支持电子商务网络营销的设计和开展。我们讨论的技术性仅网销平台设计和使用技术的范畴,主要包括通信网络技术和安全技术两个方面。
1.网络通信技术。当前我们使用的网络基本上是通过TCP/IP协议进行通信,可分为企业内部网、企业外部网和互联网,该通信协议基本能够满足企业之间的内部管理运用及企业之间根据相互约定的规则形成一套非常有效的信息交换系统,并通过此系统改善生产、运作、合作的水平。
2.网络安全技术。安全问题主要来自于网络安全技术本身的设计缺陷,在运用于交易过程中一般会包含以下几类需要注意的问题:(1)隐私问题,涉及诸多的非公开信息,如姓名、账号、密码、交易对象、数量、金额等;(2)身份认证,例如账号盗用、网络诈骗、虚假交易等行为层出不穷;(3)信息完整性,在交易中包含着身份信息、交易过程各个环节的信息要完整可靠,要有整套交易记录;(4)不可抵赖性, 收稿日期:2018-01-25
作者简介:李建元(1985—),男,福建上杭人,讲师,硕士,研究方向:电子商务。
第1期 李建元:电商营销精确搜索引擎的优化设计与实现 83 要有交易过程的证明,证明应该具有权威性、不可抵赖性和防篡改性。
总体而言,当前电子商务营销领域技术基础已经足够满足一般网络用户的使用需求,电商企业在其运营和发展的过程中可以运用搜索引擎等网络技术工具。
(二)电子商务营销实效性分析
我们通过单因素方差测试与分析,把选取的各搜索引擎的相关性进行比对,从而来分析它们之间的时效性。如表1所示。
表1搜索引擎有效差异ANOVA分析
样本数据 百度搜索 谷歌搜索 雅虎搜索 总计 样本数 689 668 567 1924 均值 2.09 2.13 2.41 2.2 标准方差 0.65 0.63 0.52 0.64
ANOVA分析
组间 组内 总计
平方和 35.44 789.84 821.88
df 2 1921 1923
均方 17.72 0.41
F 43.22
通过三个不同的搜索引擎的比较研究可以计算出F(0.05, 2192 1)= 2.9957。因此,不同的搜索引擎有一定的算法和精度的差异。显然,雅虎的有效性比百度和谷歌的有效性更高(见表1)。因此,不同精度的搜索引擎对通过电子商务购物的消费者来说,将对搜索的结果产生不同的差异。精确度较高的搜索引擎网络搜索引擎优化和设计的精密性程度对电子商务网络营销有很大影响,电商企业借助高精度的搜索引擎能够实现商品信息的精准推送,以便在整个销售过程中占据有利地位。
二、电子商务营销搜索引擎的精确度优化设计
Web站点 用户接口 查询模块 索引数据库 机器人模块HTM文档和XML文档 索引模块 分析模块 站点模式 转换模块 FTML文档 解析模块 图1 精确搜索引擎的基础框架 (一)精确搜索引擎的基础框架
84 漳州职业技术学院学报 2018年
收集索引和查询模块是常规搜索引擎的两个主要部分。而精确搜索引擎不但这两个部分,同时增加了分析模块和ISML语言标志设计的格式转换模块。当前,大多数在互联网上(Internet)的页面是使用HTML和XML编写的。如果是运用XML编写的网页,高精确度的搜索引擎需要先XML数据源转换HTML文档格式,然后通过分析仪将它转换成一个固定网站主题模式,并将这些网站模型通过转换模块将ISML语言标记,这是整个转换的基本过程和功能模块。基于电子商务精确搜索引擎模型可以设计成由以下六个模块组成:即蜘蛛机器人、分析模块、转换模块、解析模块、索引模块和查询模块[4]。如图1所示。
(二)精确搜索引擎的实现路径
信息提取算法、文档解析算法、规则匹配算法及相关性文档生成算法是精确搜索引擎设计的主要几个部分,其构思基本逻辑是通过蜘蛛模块收集、掌握电子商务销售网站的相关信息,然后根据规则提取树模型和信息提取算法对信息进行进一步提取,并在人工注释的指向下自动学习信息提取规则,实现提高信息提取精度。
HTML语言文件解析工具是一个HTML语言的文件结构,该结构是由使用标识有限自动机的状态转换图描述令牌算法,通过HTML格式标准考虑膨胀的各种类型的节点而设计的。所以,HTML文件解析工具是一个包括所有的元素层次结构树且能为自动标记及其他后续工作做准备的集成模块,它应该要同时能够实现,提取、标记、分析等功能。详细如下:
输入:层次结构树的结构元素
输出:XML文档或解析HTML文档和相关元素的数组 过程:
New Elem (“ROOT”) :
While {CurToken = GetToken ( ) ) //循环获取HTML 文档中的Token {switch (CurToken type)
case COMMENT, PI, CDATA, SECTION, JSTE, PHP, ASP, ENDTAG: CONTINUE; case DOCTYPE:
//在结构树根节点的子节点里加入遇到的第一个文件类型 if
InsertElemAtEnd (ElemArray[0], NewElem (“DOCTYPE”) ) ; continue; case else
html = NewElem (“HTML”) ;
if (CurToken实施标记非HTML元素) 设置当前的Token为未被使用标识; else
复制CurToken. Attributes 的内容到html attributes; InsertElemAtEnd (ElemArray[0], html) ; 调用ParseHTML分析HTML元素的内容; Exit while;
第1期 李建元:电商营销精确搜索引擎的优化设计与实现 85
}}
信息提取算法可以把良好的预处理器链标记结构格式标签。它的设计主要功能是: 要通过提取规则来确认每个格式标签字符串在相应的内容和链匹配中是否一致,同时还要检查并确认链的第一个标签和提取规则的ID为0是否一致,
如< ISML:madefrom ID = 3 / >需求链中在当前标签字符串包含限定符(商品产地:)和中低标签文本之间的链只包含“< /li >”限定符。以此类推,如果链和提取规则的字符串可以相互匹配到最后格式标签,那么则匹配成功;如果匹配不成功,用户再一次进行文档标注,同时形成新的规则,这是由系统和规则库添加到匹配规则,直到最终匹配成功。
此外,因为越多的信息提取会大大增加规则库的更新频率,将导致匹配效率低。解决这个问题可以通过规则匹配算法来解决。以下对基本构想作简要介绍:
构建一个链式结构(如图2),该结构是根据一个根节点为树形模型的初始状态,定义标识各个提取信息规则然后先后加入该链式结构中,用于匹配信息数据标识,匹配若不成功,就将该匹配失败的规则后续部分链接到前一次匹配成功的节点上,让程序完成所有匹配指令;匹配若成功,则由链式结构继续匹配后续内容。
该链式结构能够实现大量缩短匹配时间,提高匹配效率的地方在于:在确保每个节点标签的各路径的节点表识相互匹配的基础上,采用深度遍历搜索路径的原理,当识别到某条路径可以形成关联规则,则系统根据该路径信息提取相关标签链,然后这些所有别提取的标签链将会比存储在规则库中,当发生匹配失败时就可以在当前节点调取规则库进行直接再匹配,不用再从头开始匹配。这种方法当发生海量规则标签的环境下,其效率优势将更为明显。(如图2所示) ID 0 attmame class value mc fore tabcon next null ull 图2 链式结构匹配
name div atributes intertext Null parent -1 firstchild 1 lastchild 1 prew -1 next -1 三、电子商务营销搜索引擎算法的定量分析
精确搜索引擎算法的定量分析主要是通过关键词提取与检索实验来检验。本实验把“折800”“名品打折网”“我要打折网”“名购网”“生活美”“通辽打折网”“易购打折网”等几家电子商务折扣网站加入精确算法的搜索引擎搜索结果进行实验并比较。
软硬件环境:
CPU:英特尔 I7 4770 3.40GHz 内存:DDR3代,3.64GB;
软件平台:.NET 2008平台,C#编程语言; 操作系统:微软视窗系统7 企业普通版: 数据库平台:SQL Server 2008.
为了能够反映出关键词对电商搜索引擎搜索结果的影响,实验将选取不同的关键词来进行搜索比较,
86 漳州职业技术学院学报 2018年 同时还将依照大宗商品综合性及搜索关键词的准确性两个特征作为实验指标分别测试搜索引擎(见表1);其中在上述两个测试指标中,分别选取5个关键词进行搜索测试,依照评价指标对对应的电商营销平台进行评价划分等级(见表2),最后在表3中汇总各个电商营销平台的实验结果。
表1 准确度检索词和商品综合性特征
准确度检索词
选择准则 单独的商品名 复合的商品名 商品的商标 商标名和商品名 由特点的名字
T恤 短裤T恤 以纯 以纯短裤T恤 淑女坊
服装店
长裤 秋季长裤 NIKE NIKE秋季长裤 阿迪达斯
选取的准则 综合性别和商品
综合价格别和商品
综合性别和商品
综合折扣和商品
综合尺码和商品
商品综合特征
服装店 男士西裤 20元以下 袜子 黑色T恤 2折首饰 加大号裙裤
女士短裤 50元以下球鞋 紫色背心 5折西裙子 中号手套
表2 相关等级标准及评价指标
等级标准 五级 四级 三级 二级 一级
评价指标 最好
较好,可以接受,但不是最好 一般,可以接受,但有待提高 较差,不可以接受,需改进 差等,完全不能接受
表3 实验结果
打折网 折800 名品打折网 我要打折网 名购网 生活美 通辽打折网 易购打折网
准确度 五级 三级 一级 一级 二级 一级 一级
商品综合特征检索
五级 三级 一级 一级 二级 一级 一级
从表3可以看出,通过对“折800” “名品打折网” “名购网”的等多款搜索引擎进行对比实验,可以看出“折800”和“名品打折网”大宗商品电子商务引擎综合特征检索精度评价分数分居于第一、第二位,证明了电子商务搜索引擎可以给客户一个最准确的搜索结果,说明了精确搜索引擎更大范围地搜索匹配的商品信息,的并具有良好的精度和响应速度,能够大大提高用户的使用效果。
当前电子商务崛起使得网上销售竞争越发激烈,各种各样的购物网站上优惠、折扣、促销等信息常常会使消费者眼花缭乱,开发全球性折扣信息收集的电子商务网站,具有较高的应用价值和现实意义,而高精确度的搜索引擎是该类网站的基本要求。基于电子商务和高精确度搜索引擎模型具有良好的精度和响应速度,能够更好地折扣信息查询到相关产品,提高用户对商品信息比对的效率和搜索体验,具有较高的实用价值。
第1期 李建元:电商营销精确搜索引擎的优化设计与实现 87
参考文献: [1] WHITE R W,RUTHVEN I,JOSE J M.A study of factors affecting the utility of implicit relevance feedback[C]//Proceedings of
the 28th ACM SIGIR Conference.New York:ACM Press,2012:35-42. [2] 中国互联网络信息中心. 第38次中国互联网络发展状况统计报告
[EB/OL].(2012-01-15)http://www.cnnic.net.cn/hlwfzyjhlwxzbg/hlw/201601/t20120115_38508.htm. [3] 朱中平. 搜索引擎营销的原理与模式分析[J]. 物流与采购研究,2013(45):94. [4] 王非. 中文电子商务搜索引擎有效性比较[J]. 情报杂志,2012(4):128-129.
[5] 彭振龙. 搜索引擎营销在电子商务中的应用分析[J]. 长春教育学院学报,2012(12):58-59.
(责任编辑:黄文丽)
Optimal design and implementation of precise search engines
for e-commerce marketing
LI Jian-yuan
(Zhangzhou Institute of Technology, Zhangzhou, Fujian, 363000, China)
Abstract: Currently, e-commerce website discount inherent limitations exist, more and keep the requirements of the times. Develop an accurate search engine search discount information, an issue of concern to the electricity business marketing. This paper follows the basic framework of precise search engine, integrated use of document parsing algorithm, information extraction algorithms, rule matching algorithms and related documentation generation algorithm to optimize the design, the construction of the application of e-commerce marketing model Refine search engine. Experiments show that it has to obtain a more accurate and comprehensive information on the ability of discounts and have good accuracy and responsiveness.
Key words: E-commerce marketing; refine search engine; optimal design; realization path
因篇幅问题不能全部显示,请点此查看更多更全内容