最强AI翻译插件:沉浸式翻译接入

  • 沉浸式翻译
  • AI驱动的双语网页翻译扩展
  • 免费的,好用的,没有废话的,革命性的,饱受赞誉的

腾讯交互翻译(TranSmart)

  • 国产免费翻译软件
  • 帮助用户更快、更好地完成翻译任务
  • 融合了交互式机器翻译、神经网络机器翻译、统计机器翻译、语义理解、信息检索等技术

Translumo:屏幕实时翻译工具

  • 能够实时检测并翻译屏幕上出现的文字,例如外国电影的字幕、游戏中的对话,网页上的文章,外文版的论文等
  • 软件内置了三款强大OCR识别功能,可以识别英语、俄语、中文等语言
  • 开源免费,文本识别精度高,延迟低,界面简洁美观
  • 项目仓库:https://github.com/Danily07/Translumo

沉浸式英文学习利器:DashPlayer

  • 款专为英语学习者设计的视频播放器
  • 提供了双语字幕、按句跳转、单词翻译、可调整布局等功能
  • 集成了下载视频、生成字幕、分割长视频等工具
  • 免费开源:https://github.com/solidSpoon/DashPlayer

Floccus –跨平台浏览器书签同步插件

Llama3-RankRAG让GPT-4都吃灰

  • NVIDIA开源新模型-Llama3-RankRAG
  • AI界的超级赛亚人,不仅能打,还能变身
  • 在9个知识密集型基准测试中,把GPT-4摁在地上摩擦,还在5个生物医学领域的RAG基准测试中与GPT-4平分秋色
  • 先是像个挑剔的老太太,把所有文档都仔细看一遍,挑出最相关的几个,然后才开始回答问题。这样不仅省时省力,还能保证回答的质量
  • 可以在不同的检索器之间自由切换,还能适应新的领域
  • 论文地址:https://arxiv.org/html/2407.02485v1

Jvedio:功能强大的本地视频管理神器

开源神级录屏软件:Captura

  • 截屏静态画面
  • 捕获动态视频(avi / gif / mp4)
  • 使用/不使用鼠标光标进行捕获
  • 捕获特定区域、屏幕或窗口
  • 捕获鼠标单击或击键
  • 混合从麦克风和扬声器输出录制的音频
  • 项目仓库:https://github.com/MathewSachin/Captura

多功能Steam工具:Watt Toolkit

PixiEditor轻量级像素艺术编辑器

  • 为您的游戏、动画(即将推出)创建精美的精灵,并编辑图像
  • 使用对眼睛友好的黑暗主题
  • 轻快熟悉的操作界面,与Photoshop或Gimp等类似的体验
  • 速度很快,在任何画布尺寸上绘图都感觉流畅,开发了基于块的原始系统和自适应渲染,以最大限度地减少像素处理时间
  • 项目仓库:https://github.com/PixiEditor/PixiEditor

DeepSeekMath-全球首届AI竞赛首选

  • 全球首届人工智能数学奥林匹克竞赛(AIMO)于近日公布了进步奖获奖名单
  • 获奖的Top4团队不约而同地都选择了 DeepSeekMath-7B作为基础模型
  • DeepSeekMath-7B取得了出乎意料的准确率
  • DeepSeekMath一个7B模型但有逼近GPT-4的数学推理能力
  • 在MATH基准榜单上超过一众30B~70B的开源模型
  • GitHub主页:https://github.com/deepseek-ai/DeepSeek-Math

TTS神器fish.audio,体验丝滑

  • 模拟出的声音来和真人相似度70%左右
  • 为所有人准备的音频 AI
  • 自然、富有表现力的语音生成
  • 打造智能、亲切的 AI 伙伴
  • 人人可用的语音 AI
  • 项目主页:https://fish.audio
  • 项目源码:https://github.com/fishaudio

Gollama:管理Ollama最简方式

  • 提供了一个文本用户界面 (TUI)
  • 管理 Ollama 模型,如列出、检查、删除、复制和推送
  • 允许使用热键交互方式对模型进行选择、排序、过滤、编辑、运行、卸载等操作。
  • 项目仓库:https://github.com/sammcj/gollama

功能丰富的协作式知识库系统:outline

  • 语雀飞书平替
  • 快速协作式的团队知识库
  • 提供一个美观、易于使用的界面
  • 允许团队成员以实时方式协作编辑文档
  • 支持Markdown
  • 项目仓库:https://github.com/outline/outline

LanceDB:开源的向量搜索引擎

  • 高效、智能、创新
  • 支持向量、元数据及多模态数据(包括文本、图像、视频、点云等)的存储、查询和过滤。
  • 兼容向量相似性搜索、全文搜索和 SQL 语言。
  • 提供原生的 Python 和 Javascript/Typescript 支持。
  • 在构建向量索引时提供 GPU 加速支持
  • 项目仓库:https://github.com/lancedb/lancedb
  • 项目主站:https://lancedb.com

阿里诚意开源:SenseVoice

  • 中文表现非常优秀
  • 高精度多语言语音识别:支持 50 多种语言,识别性能超越了Whisper
  • 具备出色的情绪识别能力
  • 提供声音事件检测能力,支持bgm、掌声、笑声、哭声、咳嗽声、打喷嚏等各种常见人机交互事件的检测
  • 高效推理:极低的推理延迟,只需要70毫秒即可处理10秒的音频
  • 项目仓库:https://github.com/FunAudioLLM/SenseVoice
  • demo地址:https://www.modelscope.cn/studios/iic/SenseVoice

MimicBrush:P图不求人

Neurite:火爆的AI大脑工具

  • 融合chatGPT和本地GPT的思维导图助手工具
  • 融合思维导图和知识管理
  • 利用AI技术进行信息和知识学习,并建立信息间复杂思维关系
  • 同步知识管理:思维导图与卡片式知识管理的完美融合
  • 项目地址:https://github.com/satellitecomponent/Neurite

Mem0 AI:开源一天斩获万星

  • 超越 RAG,为LLM、Agent添加超强个性记忆
  • 多层次的记忆:它能记住用户的偏好、过去的交互、事情的进展,就像你跟朋友聊天,朋友能记住你喜欢什么、不喜欢什么
  • 自适应的个性化:从交互中持续学习,越用越聪明,真是个贴心的小助手
  • 跨平台、API 友好:支持私有化部署,开发者可以轻松集成到各种平台
  • 项目地址:https://github.com/mem0ai/mem0

Snowflake-Arctic-Embed:突破性文本嵌入模型

Chameleon:全球首个混合生成图文的模型

  • 由Meta公司FAIR团队研发的多模态模型
  • 能够理解和生成任意序列的图像和文本
  • 在长篇混合模式生成评估中,匹配或超越了包括Gemini Pro和GPT-4V在内的更大模型的性能
  • 项目仓库:https://github.com/facebookresearch/chameleon

SmolLM:性能炸裂碾压一众竞品

  • Hugging Face发布
  • 完全开源的小型语言模型
  • 参数量从 135M 到 1.7B 不等
  • 可以在手机上流畅运行
  • 打败了99%的对手
  • 官方介绍:https://huggingface.co/blog/smollm

NeMo:当前最好的开源LLM

私人电子图书馆:TaleBook

ELibrePhotos: 开源照片管理服务平台

  • 灵活的照片组织,支持按标签、日期、相册组织照片
  • 智能搜索功能,通过关键词快速定位照片
  • 共享和协作,轻松地分享照片,并进行合作编辑
  • 项目地址:https://github.com/LibrePhotos/librephotos

DeepSeek-Chat-V2.1开源

LitGPT:预训练、微调及部署神器

  • 快速、高效的使用、微调、预训练和部署大型语言模型
  • 集20+款高性能大型语言模型于一体
  • 无抽象层:所有模型都是从头开始实现的,没有抽象层,提供了完整的控制能力。
  • 开发者友好:易于调试,实现简单,单文件实现。
  • 优化性能:设计用于最大化性能,降低成本,加快训练速度。
  • 项目地址: https://github.com/Lightning-AI/litgpt

Ludwig低代码框架,简化大模型微调

  • 极简上手: 支持多任务和多模态学习,提供全面的配置验证功能
  • 高效性和可扩展性:自动选择最佳批量大小,提供参数高效微调
  • 专家级控制:提供超参数优化、模型可解释性分析以及丰富的指标可视化工具
  • 模块化和可扩展设计:极大地提升了模型开发的灵活性
  • 仓库地址:https://github.com/ludwig-ai/ludwig
  • 官网地址:https://ludwig.ai

Pinokio:一键安装开源 AI 应用

强大的书签导航页工具

强大的全平台文件同步神器:Syncthing

  • 数据安全:采用了多种加密技术来保护用户数据,确保文件在传输过程中不被窃取或篡改。
  • 去中心化:作为一个P2P应用,不需要中心服务器,降低了单点故障的风险,提高了系统的稳定性。
  • 跨平台:支持Windows、macOS、Linux等多种操作系统,用户可以在不同平台上无缝同步文件。
  • 易于使用:提供了图形用户界面(GUI)和命令行界面(CLI)
  • 高效同步:采用块级增量更新,只传输改变的部分,提升同步效率。
  • 项目仓库:https://github.com/syncthing/syncthing

[Glyph-ByT5-v2多语言高精度文字海报]

  • 微软亚洲研究院、清华大学、北京大学、利物浦大学联合推出
  • 渲染高视觉美感文本惊艳海报,效果媲美DALL-E3
  • 支持10种不同语言的准确视觉文本渲染
  • 项目仓库:https://github.com/AIGText/Glyph-ByT5

英文视频转成中文:EasyVideoTrans

视频剪辑的重磅AI神器:FunClip

  • 基于阿里巴巴通义实验室自研并开源的FunASR工具包
  • 集成了阿里巴巴开源的工业级模型Paraformer-Large
  • 集成了SeACo-Paraformer的热词定制化功能,提升识别效果
  • 集成了CAM++说话人识别模型,自动识别出的说话人ID
  • 支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段落SRT字幕
  • 项目仓库:https://github.com/alibaba-damo-academy/FunClip