原始资料 PDF或者word
|
网友回复:
注册: Es也就调个Api而已,相似度用文本指纹,搜索下,局部敏感哈希
duyu5x: PDF不自带OCR就嗝屁吧
生蚝QAQ: 这种看起来简单,实际很麻烦的活还是去找外包吧
h20: 如果是汉字的查询,10万起。如果查询的内容没有汉字,1万就可以了
maintell: 你是想把pdf的名字导入数据库还是把pdf内容导入数据库
zctr: es
cherbim: 方案也知道 但是搞不定
duyu5x: 大佬们出来接活
生蚝QAQ: 无非就是把内容建个索引,然后API做查询。
注册: 20W
注册: IO操作,很简单应该
cnly1987: 这个没有几万怕是下不来,你pdf越多越贵, 建议你预先给个价,要不然大佬们都不想看 帮你顶起来找大佬。
thorn: 已经在找了
van: 50w
duyu5x: 谢谢大佬 记下了
晴晴晴: 这个要先转文本 再入库,难度太高了