开源替代品

Ahmia搜索引擎实例

正在查看 6 条回复
  • 作者
    帖子
    • #2112

      http://skyland5tvtpnmddkg3xsftsex4jwdwhx6ell2j7ldnypm5qz35y2wqd.onion/search/?q=%E4%B9%A0%E8%BF%91%E5%B9%B3
      部署遇到问题或者需要主题设计原稿可以回帖。
      遇到这个站点完全是搜索引擎爬虫的功劳,关于爬虫的部署细节也可以回帖提问。
      juhanurmi的主仓库在2024年4月完成主要更新,6月一次提交。我的修改不敢推到github,闲下来推到自己的git托管。

    • #2113
    • #2116
      Up
      0
      ::

      DuckDuckGo有暗网版,暗网版是明网版的反向代理,使用的一样是Bing的搜索API,所以没有收录暗网网站。
      如果要搜索暗网中的网站用这个Ahmia感觉不错,页面挺美观的,

    • #2117
      Up
      0
      ::

      页眉和内容貌似有重叠遮挡:http://skyland5tvtpnmddkg3xsftsex4jwdwhx6ell2j7ldnypm5qz35y2wqd.onion/about/

      • #2119
        Up
        0
        ::

        刚刚起步,还因为服务器资源问题停机过半年。关于遮挡问题是Ahmia原站的内容和新的主题设计不匹配,时间比较紧张只是把搜索功能和主页做出来了其他的都还没有做主题。而且站点还是需要多语言的,做了英语语言包。

    • #2118
      Up
      0
      ::

      运行一个搜索引擎很吃服务器资源吧,如果流量暴增能像明网网站一样扩展吗?

      还有就是搜索结果能按语言搜索就好了,然后还可以加个安全搜索功能,有的时候不想看到色情和毒品。

      总之感谢站长运营这么一个公益搜索引擎,希望可以做得更好。

      • #2121
        Up
        0
        ::

        后端采用elasticsearch,可以加集群,但是现在没钱加集群了qwq。硬盘快吃满了,打算过段时间扩容硬盘加爬虫深度。

        • #2124
          Up
          0
          ::

          没有深入接触过ES,假如我要搭建这个搜索引擎是否要配置中文分词?

          • #2125
            Up
            0
            ::

            应该是不用的,完全按照github的仓库readme来就可以。有一点需要注意:框架版本要选对 Django 5.0.x 和 elasticsearch 8.0。如果是2024年更新前的版本,框架版本问题可能会更难解决。

            • #2276
              Up
              0
              ::

              如果没有中文分词,ES的英文分词器会把每个汉字分开搜索,搜索效果不佳。
              暗网上中文网站也就那几个,站内搜索就已经很可用了,没有必要再用搜索引擎。

      • #2123
        Up
        0
        ::

        按语言搜索、安全搜索这些功能还是要学习一个,目前还没有能力实现。

    • #2127
      Up
      0
      ::

      暗网上的信息量还是太少了,真要解决问题还是得用明网搜索。也许可以做一个中文版暗网维基呢,相当于是一个网址导航。

      • #2128
        Up
        0
        ::

        有这个想法,部署完jschan就去部署mediawiki(或者dokuwiki?)。

        • #2129
          Up
          0
          ::

          搭建一个Mediawiki暗网维基农场,类似于fandom的模式,用户能申请创建维基,由于洋葱域名生成起来无成本,每个维基都能有独立的域名。

          • #2135
            Up
            0
            ::

            抄收。可能要魔改一下服务器了。等有磁盘空间把队列的服务部署完毕就部署wiki。

    • #2146
      Up
      0
      ::

      站点可能要离线约12小时。

正在查看 6 条回复
  • 哎呀,回复话题必需登录。