博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
(二) solr 索引数据导入:xml格式
阅读量:5909 次
发布时间:2019-06-19

本文共 941 字,大约阅读时间需要 3 分钟。

xml 是最常用的数据索引格式,不仅可以索引数据,还可以对文档与字段进行增强,从而改变它们的重要程度。

下面就是具体的实现方式:

schema.xml的字段配置部分如下:

以下是我们将要提交到solr作为索引的xml文档:books.xml

1
ABC1234
Some Book
2
ZYVW9821
Important Book
3
NXJS1234
Some other book

 

说明:

overwrite="true" :告诉solr在做索引的时候,如果文档已经存在,就用xml中的文档进行替换

commitWithin="10000" :告诉solr 在做索引的时候,每个10000(10s)毫秒,做一次文档提交

boost:用来指明文档或者字段的重要程度,默认值为:1.0,在这个示例中,第二个文档的boost值为2.5,表示比其它两个文档更重要

omitNorms="false":这个属性值表示是否忽略字段的的规范,此处设为否。如果要在做索引的时候指定字段的重要程度,必须使用字段的长度规范。

                              如果设置为true,那么这些字段在索引时不会增加重要程度

 

如果在linux下,我们可以使用下面的方式提交文档

curl http://localhost:8983/solr/update --data-binary @books.xml -H 'Content-type:text/xml; charset=utf-8'

 

 

转载于:https://www.cnblogs.com/xiazh/archive/2012/10/29/2544741.html

你可能感兴趣的文章
转: 深入理解Java内存模型(一)——基础
查看>>
BTree和B+Tree详解
查看>>
Struts2_03_控制器(过滤器/拦截器/Action)
查看>>
3D打印浪潮中的赢家与输家
查看>>
文件系统在NVMe SSD上的性能表现分析
查看>>
链接自动化测试工具xenu
查看>>
令人疑惑的defaultValueAttribute
查看>>
AWR Wait Class
查看>>
一帆风顺中的煎熬,《腾讯传》读后感
查看>>
三星i917官方wp7.8刷机、越狱、防锁全过程
查看>>
区块链初始化与实现POW工作量证明
查看>>
vsftp安装与下载
查看>>
win10系统80端口被占用怎么办
查看>>
对《微营销》与《大数据营销》的读后思考
查看>>
hadoop(2.5,2.6) HDFS偶发性心跳异常以及大量DataXceiver线程被Blocked故障处理分享
查看>>
闲睱小记 ——于世
查看>>
Zabbix应用之Server/Agent部署
查看>>
Python从菜鸟到高手(13):分片(Slicing)
查看>>
关于Oracle表空间创建时间的探究
查看>>
Weblogic "./startWebLogic.sh" Error 解决
查看>>