dacongyun.com
分享国内外服务器主机优惠信息

代写个程序【结贴】

原始资料 PDF或者word
需求 将PDF或者word全文存入数据库
        判断重复
        查询关键词模块
        查询是能够查询得到关键词的上下文,将查询结果输出为csv
       
       

       
       
       
       

网友回复:

注册 Es也就调个Api而已,相似度用文本指纹,搜索下,局部敏感哈希

duyu5x PDF不自带OCR就嗝屁吧

生蚝QAQ 这种看起来简单,实际很麻烦的活还是去找外包吧

h20 如果是汉字的查询,10万起。如果查询的内容没有汉字,1万就可以了

maintell 你是想把pdf的名字导入数据库还是把pdf内容导入数据库

zctr es

cherbim 方案也知道 但是搞不定

duyu5x 大佬们出来接活

生蚝QAQ 无非就是把内容建个索引,然后API做查询。

注册 20W

注册 IO操作,很简单应该

cnly1987 这个没有几万怕是下不来,你pdf越多越贵, 建议你预先给个价,要不然大佬们都不想看 帮你顶起来找大佬。

thorn 已经在找了

van 50w

duyu5x 谢谢大佬 记下了

晴晴晴 这个要先转文本 再入库,难度太高了

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

真正的个人支付接口

云免签H5支付