范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

lilySolr原理与配置

  概述 为什么要引入lily和solr
  在Hbase中,表的RowKey 按照字典排序, 单一的通过RowKey检索数据的方式,不再满足更多的需求,查询成为Hbase的瓶颈,希望像Sql一样快速检索数据,Hbase之前定位的是大表的存储,要进行这样的查询,往往是要通过类似Hive、Pig等系统进行全表的MapReduce计算,这种方式既浪费了机器的计算资源,又因高延迟使得应用黯然失色,于是HBase Secondary Indexing的方案出现了。 SolrSolr是一个独立的企业级搜索应用服务器,是Apache Lucene项目的开源企业搜索平台,其主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据库集成,以及富文本(如Word、PDF)的处理。Solr是高度可扩展的,并提供了分布式搜索和索引复制。Solr 4还增加了NoSQL支持,以及基于Zookeeper的分布式扩展功能SolrCloud。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎,Solr可以高亮显示搜索结果,通过索引复制来提高可用,性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面。 Key-Value Store Indexer
  这个组件非常关键,是Hbase到Solr生成索引的中间工具,在CDH5.3.2中的Key-Value Indexer使用的是Lily HBase Indexer 服务,Lily HBase Indexer是一款灵活的、可扩展的、高容错的、事务性的,并且近实时的处理HBase列索引数据的分布式服务软件。它是NGDATA公司开发的Lily系统的一部分,已开放源代码,Lily HBase Indexer使用SolrCloud来存储HBase的索引数据,当HBase执行写入、更新或删除操作时,Indexer通过HBase的replication功能来把这些操作抽象成一系列的Event事件,并用来保证写入Solr中的HBase索引数据的一致性,并且Indexer支持用户自定义的抽取,转换规则来索引HBase列数据。Solr搜索结果会包含用户自定义的columnfamily:qualifier字段结果,这样应用程序就可以直接访问HBase的列数据。 hbase+lily+solr架构
  服务配置
  hbase配置文件搜索index,启用编制索引。
  启用复制
  solr collection创建脚本 # 用来创建solr collection cat > createcollection.sh << EOF # zk节点 ZK="worker-1" # 要创建的collection名称 COLLECTION="hainiu" BASE=`pwd` # 分片数 SHARD=1 # 副本数 REPLICA=1 echo "create solr collection" rm -rf tmp/* # 生成配置文件 solrctl --zk $ZK:2181/solr instancedir --generate tmp/${COLLECTION}_configs # 上传配置文件到zk solrctl --zk $ZK:2181/solr instancedir --create $COLLECTION tmp/${COLLECTION}_configs echo "如果collection名称重复会报configuration重复错误,更换collection名称" # solr创建collection solrctl --zk $ZK:2181/solr collection --create $COLLECTION -s $SHARD -r $REPLICA echo "如果collection名称重复会报configuration重复错误,更换collection名称" # 查看collection solrctl --zk $ZK:2181/solr collection --list EOF执行创建脚本 sh createcollection.sh
  solr web验证
  solr创建field字段
  使用postman或者curl命令操作solr api创建字段
  方式一postman:
  方式二curl: # 非安全模式 curl -X POST -H "Content-Type:application/json" -d "{     "add-field":{         "name":"content",         "type":"text_en",         "stored":true,         "indexed":true     } }" http://worker-3:8983/solr/hainiu/schema# 安全模式 用户名和密码可以随意输入 curl --negotiate -u xiniu:xiniu -X POST -H "Content-Type:application/json" -d "{     "add-field":{         "name":"content",         "type":"text_en",         "stored":true,         "indexed":true     } }" http://worker-3:8983/solr/hainiu0602/schema
  lily hbase indexer mkdir -p /root/solr-hbase/conf cd /root/solr-hbase准备morphline配置文件(解读) # 准备morphline配置文件 morphlines : [   {     # morphline配置id,与indexer配置文件中的morphlineID一致     id : morphline1      importCommands : ["org.kitesdk.morphline.**", "com.ngdata.**"]     commands : [     {         extractHBaseCells {           # hbase字段映射           mappings : [             {               # textinfo为hbase对应的列族,content为hbase对应的列名               inputColumn : "textinfo:content"               # 输出列,对应solr中的field字段               outputField : "content"               # solr中字段类型               type : "string"               source : value             }]         }     }     ]   } ]
  正式配置文件 cat > conf/morphlines.conf << EOF morphlines : [   {     id : morphline1      importCommands : ["org.kitesdk.morphline.**", "com.ngdata.**"]     commands : [     {         extractHBaseCells {           mappings : [             {               inputColumn : "textinfo:content"               outputField : "content"               type : "string"               source : value             }]         }     }     ]   } ] EOF准备indexer配置文件 cat > conf/indexer-config.xml << EOF <?xml version="1.0"?>                            EOF执行lily hbase indexer刷新脚本 vim hbase2solr.sh # 填入如下内容 COLLECTION="hainiu" ZK="worker-1" echo "Delete previous docs..." solrctl collection --deletedocs $COLLECTION echo "Lily HBase MapReduce indexing..." config="/etc/hadoop/conf.cloudera.yarn" parcel="/opt/cloudera/parcels/CDH" jar="$parcel/lib/hbase-solr/tools/hbase-indexer-mr-*-job.jar" hbase_conf="/etc/hbase/conf/hbase-site.xml" opts=""mapred.child.java.opts=-Xmx1024m"" log4j="$parcel/share/doc/search*/examples/solr-nrt/log4j.properties" zk="$ZK:2181/solr" # libjars="lib/lucene-analyzers-smartcn-4.10.3-cdh5.14.2.jar" # export HADOOP_OPTS="-Djava.security.auth.login.config=conf/jaas.conf" hadoop --config $config jar $jar --conf $hbase_conf -D $opts --log4j $log4j --hbase-indexer-file conf/indexer-config.xml --verbose --go-live --zk-host $zk --collection $COLLECTION安全模式执行lily hbase indexer刷新脚本
  创建jaas.conf文件,填写如下内容 mkdir -p conf/jaas.confClient {   com.sun.security.auth.module.Krb5LoginModule required   useKeyTab=true   keyTab="/root/solr-hbase/solr.keytab"   storeKey=true   useTicketCache=false   principal="solr@HAINIU.COM"; };vim hbase2solr.sh # 填入如下内容 COLLECTION="hainiu" ZK="worker-1" echo "Delete previous docs..." solrctl collection --deletedocs $COLLECTION echo "Lily HBase MapReduce indexing..." config="/etc/hadoop/conf.cloudera.yarn" parcel="/opt/cloudera/parcels/CDH" jar="$parcel/lib/hbase-solr/tools/hbase-indexer-mr-*-job.jar" hbase_conf="/etc/hbase/conf/hbase-site.xml" opts=""mapred.child.java.opts=-Xmx1024m"" log4j="$parcel/share/doc/search*/examples/solr-nrt/log4j.properties" zk="$ZK:2181/solr" # libjars="lib/lucene-analyzers-smartcn-4.10.3-cdh5.14.2.jar" export HADOOP_OPTS="-Djava.security.auth.login.config=conf/jaas.conf" hadoop --config $config jar $jar --conf $hbase_conf -D $opts --log4j $log4j --hbase-indexer-file conf/indexer-config.xml --verbose --go-live --zk-host $zk --collection $COLLECTION执行hbase2solr.sh脚本 sh hbase2solr.sh
  solr web验证数据
  海汼部落原创文章,原文链接:(http://hainiubl.com/topics/75587)

高通WiFi6路由器方案有多强?高性能网络调度器是点睛之笔要说最近几年手机圈科技圈什么最火,5G一定榜上有名。上到千行百业,下到普通消费者,几乎哪里都能看到5G的身影。而在5G建设如火如荼的同时,WiFi技术也迎来了蓬勃发展,WiFi6时华为正式部局医疗器械,打破國处领域龚断从尝试合作到直接生产,互联网公司与医疗器械的次元壁早已被打破。依靠互联网科技向医疗健康领域加快渗透和融合,是目前很多互联网公司的统一动作,苹果华为小米百度腾讯美团等皆如此。其中华为5G应用领域广阔杨倩好样的!7月24日10时17分,看到中国选手杨倩夺得东京奥运会首金,在首都机场候机的李东通过中国移动咪咕视频5G云打call,为杨倩加油喝彩。17分钟前,浙江舟山市金塘岛,一架银保监会专项整治互联网保险乱象为进一步推进互联网保险有序发展,营造公平公正的市场秩序,切实维护保险消费者合法权益,近日,银保监会发布了关于开展互联网保险乱象专项整治工作的通知(下称通知)。本次专项整治工作由银保虎牙斗鱼净利润均下滑合并被叫停后如何守住电竞赛事版权经济观察网记者周应梅合并被叫停后,斗鱼和虎牙陆续发布了2021年二季度财报。8月17日,虎牙(HUYA)发布的二季度财报显示,营收29。62亿元,同比增长9。8,净利润为1。86亿亚马逊大规模销户,跨境电商遭遇震荡关于近期亚马逊网站大规模封号销户等操作引起了相关的震动,相关被封号的企业不仅商品都被下架,并且资金也被冻结,则就导致库存积压,相关的跨境电商都遭殃,关于亚马逊的操作也引起了热议,这不是大号手环!OPPOWatch2用实力证明身份,软件应用一应俱全在如今万物互联的生态发展趋势下,各家厂商的智能设备也逐渐丰富起来。而作为智能穿戴设备的先锋成员智能手表,当然不会掉队。当初的智能手表上,在功能上与智能手环基本上都是大同小异,导致了无法在此iPhone激活面容ID怎么办?最近许多苹果用户在论坛反馈无法激活面容ID。在这篇文章中,我们将探讨可能导致该问题的原因以及解决办法。哪些iPhone机型支持面容ID?你要做的第一件事是检查您的iPhone型号是6款难以拒绝的宝藏APP,每一款都非常实用日常的生活中,手机是必不可少的,那么手机中比较实用的APP,你们都有哪些呢?今天就给大家介绍6款手机中实用的软件,每一款都超级好用,一起带大家看看吧。一去玩相册(把相册变美)推荐指诺基亚推出BH805真无线耳机首发到手价499元诺基亚方面今日宣布推出NokiaBH805主动降噪真无线耳机,首发到手价499元。诺基亚BH805真无线耳机采用ANC主动降噪,主动发射反向抗噪声波,抵消环境噪音,仿佛全世界都安静轻若惊鸿,迅如疾风DELUX多彩M700轻量型游戏鼠标轻若惊鸿迅如疾风M700轻量型游戏鼠标多彩旗下首款轻量化游戏鼠标M700正式揭幕采用主流打孔减重方案,超轻设计,灵活轻便专为游戏玩家定制,抓握舒适轻若惊鸿,迅如疾风设计感十足,小于
AMD推出RSR技术,竟是自掘坟墓?文雷科技leitech在刚刚结束不久的CES上不少厂商都拿出了一些压箱底的东西进行展示,并且也发布了不少的新品,其中AMD的锐龙6000系列英特尔的十二代酷睿移动端及英伟达的移动端又一网友买到iPhone13ProMax后封机,早在11月份就已经激活我每天都能见到很多人买iPhone翻车,有改数的有ID机扩容机黑机后封机等等。今天一大早就有网友找到我,让我帮忙看看自己新买的iPhone13ProMax512GB是否有问题。网友关于联想的再思考一个真正的成熟的社会,可以有这样那样的嘴炮,但可以更多几个柳这样或那样的阴谋实干家也好,至少有就业,有纳税,有杀出一条血路来的豪情,更能够提携年轻创业者。不可否认柳创业之初肯定还是加密兔正式下线!小米不干了近日,运营了近四年的小米区块链游戏加密兔宣布即将正式下线。2021年NFT元宇宙概念曾一度爆火,在国内也带火了不少游戏概念公司,而在国外备受追捧的区块链游戏,在国内却似乎早已被遗忘快讯丨宁德时代将推换电品牌EVOGO每经记者李硕每经编辑裴健如1月15日,每日经济新闻记者获悉,宁德时代(300750。SZ)将于1月18日发布换电品牌EVOGO。中金公司分析认为,新能源汽车补能矛盾日益凸显,换电模折叠屏,无果之争文光子星球,作者吴先之,编辑王潘过去一个月,OPPO华为小米荣耀先后发布新款折叠屏手机。到目前为止,除蓝厂之外,主流国产手机大厂皆已折叠。国产手机品牌冲击高端的语境下,折叠屏的市场人气高端旗舰TOP1?魅族18s系列,究竟强在何处?不得不说,最近这段时间,小米12系列的热度真的出奇的高。而要究其原因的话,主要还是因为今年的小米12系列正式打出了挑战苹果的口号,甚至为了正式对标苹果,小米还学起苹果,特意将小米1预言or猜想,人工智能灾难会从哪里爆发?有一个非常有名的预言家,最近发了一个非常有名的预言,说不久世界将发生人工智能危机。人类将遭遇人工智能的危害和打击。危机预言是否会成真,现在说来为时尚早。但依据现有的技术发展水平,我望眼欲穿,打开跨境电商零售进口药品之门,利大于弊省政府办公厅印发河南省开展跨境电子商务零售进口药品试点工作实施方案,河南在全国率先开展跨境电商零售进口药品试点,试点期为自国务院批复之日起3年。(大河网讯11月26日)httpsb论马云的功与过马云的功绩电商拓荒牛,网上支付的先驱,购物方式的颠覆者,高科技践行者马云的互联网思维是前瞻的,当初无人问津,政府及一些国人都不看好,以孙正义为首的外国资本却大手笔投资,经过20多年华为手机芯片紧张,能否回收二手机芯片重新利用?理论上是可以把二手手机回收后,将芯片拆下再次利用。市面上很多杂牌手机和后装的导航,功能一样,芯片也差不多,但是价格却可以做的很低,就是因为他们使用的芯片都是拆机料,华强北就有专做这