继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

🦙 📹 PinataShot:Pinata IPFS 上的 LLaMA 3.2 多模态的截图分类

德玛西亚99
关注TA
已关注
手记 443
粉丝 92
获赞 559

皮纳塔射击

图片描述

我的作品

我开发了一个SaaS 截图管理器,帮助用户可以轻松上传、分类和搜索他们的截图。该应用利用了Pinata的Files API来实现去中心化的图像存储,并集成了GROQ API的LLaMA 3.2 11B以进行截图的AI驱动分析功能。它具备OCR(光学字符识别)文本提取、自动分类及可搜索的截图画廊等功能,从而简化了大量图像和截图的管理。该应用使用Next.js在Vercel上部署,以确保可扩展性和速度。

限制

此版本的应用程序的一个限制是在使用GROQ API时只能一次处理一张图片。这一限制源于GROQ的LLaMA 3.2 11B模型当前API的限制,该模型每次请求只能处理一张图片。虽然这允许每个截图都能精准分类和命名,但这样就限制了批量处理的功能。

然而,Pinata 在这个设置中表现出色,它能够无缝处理多个图像的去中心化存储。得益于 Pinata 的强大且可靠的 基于 IPFS 的存储系统,用户一次可以上传多个截图,并且这些截图可以安全存储并轻松检索,即使等待 AI 分析也依然可以轻松检索。

演示

试试这个 Demo
这里有几个关键功能:

  • 上传接口

拖放上传截图文件并即时得到AI分析结果。

  • 对图像提问:

你可以对上传的截图或图片提问。

  • 截图集

截图会自动命名,命名内容就是AI的描述。

  • 文本搜索

使用OCR功能在截图中的文字进行搜索,比如收据或文档等。

我的代码段

你可以访问这个Github页面来查看项目的源代码。

技术堆栈

  • Next.js(前端和后端,包含无服务器API路由)。
  • Pinata的Files API(用于IPFS上的去中心化文件存储和检索)。
  • GROQ API的LLaMA 3.2 11B(用于视觉能力和文本提取)。
  • Vercel(确保可扩展性和速度的部署平台)。
  • Tailwind CSS(用于样式和响应式UI)。
  • Shadcn/ui 和 Aceternity UI(UI组件库)。
更多细节
  • Pinata的文件API 用于确保截图的安全存储并通过IPFS提取它们,确保去中心化存储和高可靠性。Pinata在管理多个文件方面表现出色,让用户能够快速存储和访问他们的截图,即使处理大量截图也是如此。

  • AI分析 使用 GROQ 的 LLaMA 3.2 11B 模型自动将截图分类为依据内容的合适名称,并通过 OCR 技术提取文本,便于轻松搜索。虽然每个图像需要逐个处理,但 Pinata 的去中心化存储通过允许用户一次上传多个图像并排队等待 AI 处理,使这一过程变得可行和高效。

这种结合了Pinata的去中心化存储和GROQ AI能力的工具对各种类型的用户都非常有用——无论是工作中的使用、个人组织,还是创意项目。

未来的改进措施
  1. 批量图像处理功能:通过探索批处理图像分析的选项来克服单一图像的限制。
  2. 高级分类算法技术
  3. 增强搜索功能,利用更精细的OCR文本提取。
  4. 用户身份验证和个人相册。
  5. 实时协作,便于分享和整理截图。
接下来,让我们看看如何运行仓库(或运行仓库系统)

要在本地运行此项目,请按照以下步骤来。

    # 1. 克隆代码库
    git clone https://github.com/yourusername/screenshot-organizer.git
    cd screenshot-organizer

    # 2. 安装依赖
    npm install

    # 3. 设置环境变量
    # 在根目录下创建一个 .env.local 文件,并添加如下内容:
    PINATA_API_KEY=your_pinata_api_key
    PINATA_SECRET_API_KEY=your_pinata_secret_key
    GROQ_API_KEY=your_groq_api_key

    # 4. 启动开发服务器
    npm run dev

    # 5. 在浏览器中打开并导航到
    http://localhost:3000

进入全屏 退出全屏

devchallenge #pinatachallenge #webdev #api #去中心化存储 (#decentralizedstorage) #AI分析 (#AIanalysis) #摩洛哥AI (#MoroccoAI)
打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP