AGenUI模型 - 高德地图联合阿里千问C端开源的原生A2UI框架高德地图联合阿里千问C端应用团队推出的业内首个端云一体原生A2UI开源框架,全面覆盖iOS、Android、HarmonyOS三端。
Mavis官网 - MiniMax Agent推出的多智能体协同工作模式用户只需下达整体目标,Mavis即可自动组建智能体团队,内部分工协作、自查纠错,一站式完成长链路复杂任务并直接交付可用成果。
Xiaomi OneVL - 小米具身智能团队自研的开源自动驾驶大模型小米具身智能团队自研的开源自动驾驶大模型,业内首创将VLA视觉-语言-动作、世界模型、潜空间推理三大技术路线统一于单一框架。
Qwen Image Edit 2511模型官网 - 阿里Qwen团队推出的开源AI图像编辑模型主打高一致性、生产级、多模态精准编辑,解决传统AI修图易出现的人物变脸、风格漂移、多人混乱等痛点,支持人像、产品、场景、文字、几何等全场景编辑,可免费体验与本地部署。
OmniWeaving视频生成框架 - 浙大 × 腾讯混元 × 南洋理工 联合发布统一视频生成框OmniWeaving是由浙江大学、腾讯混元、南洋理工大学联合推出的统一视频生成框架,突破传统开源模型单一任务局限,实现多模态自由组合与推理增强生成。
Gemini 3.1 Flash Live语音模型使用入口,Google推出的高质量实时语音交互模型模型在多项音频基准测试中表现领先,支持复杂任务执行与多语言实时对话,同时内置SynthID水印技术,确保AI生成音频可追溯,有效防范虚假信息传播。
Suno v5.5 AI音乐生成模型,Voices声音定制、Custom Models自定义模型、My Taste个性化用户可将AI生成内容作为创作素材,通过音轨分离、片段重组、风格混合等深度编辑操作,再导出分轨文件进行专业后期制作;同时音质全面升级,乐器分离更清晰、混音更精致。
Wan 2.7 AI通用多模态AI视频生成平台,支持上传九宫格图像生成视频Wan 2.7是一款专注于高质量视频创作的通用多模态AI平台,以图像、视频、音频为控制信号,核心实现主体身份持续一致与智能视频延续功能。
MiniMax Office Skills生产级办公文档引擎,docx、xlsx、pdf和pptxMiniMax Office Skills是稀宇科技开源的生产级办公文档引擎,由四大核心组件构成:MiniMax-docx(Word)、MiniMax-xlsx(Excel)、MiniMax-pdf(PDF)、PPTX-generator(PPT)。
PrismAudio音频框架官网,阿里通义实验室研发的Video-to-Audio视频生成音频框架该模型首创分解式思维链技术,先对声音内容、时机、质感与空间位置进行推理规划,再完成音频生成;同时引入语义、时序、美学、空间四大维度评估机制,实现多维度精准优化。
Composer 2新一代AI编程模型使用入口,价格仅$2.50 / 百万输入tokenComposer 2是Cursor推出的新一代AI编程模型,该模型首次采用持续预训练与规模化强化学习技术,已在Cursor平台正式上线,无需额外配置即可直接使用。
Qwen3.5-Max-Preview模型使用入口,LMArena评测平台以1464分跻身全球前五、国内第一Qwen3.5-Max-Preview 是阿里通义千问团队推出的旗舰大模型预览版,也是核心技术人员林俊旸离职后阿里推出的首个原创大模型。
StepClaw云端AI助手,阶跃AI基于OpenClaw架构推出的云端AI智能体平台搭载Step 3.5 Flash大模型,配备双核CPU、4GB内存与40GB存储,兼顾复杂任务处理与长期记忆能力,内置阶跃自研搜索工具与丰富技能生态,为个人与企业提供高效、稳定的AI自动化解决方案。
SongGeneration 2音乐生成模型,腾讯×清华开源·4B参数音乐生成大模型SongGeneration 2是腾讯与清华大学联合开源的4B参数多模态音乐生成大模型,采用混合LLM‑扩散架构与分层表征设计,实现商业级音乐生成质量。
Gemini Embedding 2模型使用入口,谷歌推出的首个原生多模态嵌入模型Gemini Embedding 2是谷歌推出的首个原生多模态嵌入模型,基于Gemini统一架构构建。其核心能力是将文本、图像、视频、音频、文档五类数据全部映射到同一向量空间。
Yuan3.0 Ultra万亿参数多模态基础模型,激活参数68.8B,基于MoE混合专家架构打造Yuan3.0-Ultra模型总参数达1.01T、激活参数68.8B,基于MoE混合专家架构打造,深度集成视觉编码器与多模态对齐模块,实现视觉与语言信息的协同建模。
Helios视频生成模型入口,北大与字节等机构联合研发的14B参数实时长视频生成模模型不依赖KV缓存、量化、因果掩码等传统加速方案,通过统一历史注入、深度压缩流、对抗分层蒸馏等原创技术,将计算成本降至1.3B模型级别,在生成速度、内容质量、长时序连贯性上全面领
《动手学大模型》系列编程实践教程该项目还联合华为昇腾推出了国产化《大模型开发全流程》系列课程,覆盖初级、中级、高级不同阶段,提供PPT、实验手册、视频等多形式教程,基于昇腾基础软硬件讲解大模型全流程开发与调
TinyClaw模型使用入口,TinyAGI开源轻量级多智能体协作框架框架支持多专业AI Agent协同工作,打通多平台消息上下文,提供可视化管控与可靠消息队列,是构建7×24小时离线/边缘侧AI助手团队的理想底座。
AngelSlim压缩工具包模型,腾讯混元AI自研开源全模态大模型AngelSlim深度集成FP8/INT8/INT4、GPTQ、AWQ等主流压缩策略,支持端到端压缩与无缝部署,产出模型可直接对接vLLM、Sglang等高性能推理框架。
Arrow 1.0模型,全球首款SVG原生AI矢量图生成模型Arrow 1.0是Quiver AI推出的全球首个SVG原生AI生成模型。与传统像素生成模型不同,它直接输出可编辑、可无限缩放的矢量图形代码,所有图像基于数学公式构建,放大不失真、体积极小。
pplx-embed模型,Perplexity扩散预训练多语言文本嵌入模型家族pplx-embed是Perplexity AI推出的新一代多语言文本嵌入模型家族,涵盖两大核心系列:面向标准检索的pplx-embed-v1与聚焦上下文感知检索的pplx-embed-context-v1,均提供0.6B和4B两种参数规模。
SkyReels V4模型使用入口,昆仑万维全球首创多模态音视频生成大模型在Artificial Analysis全球音视频生成榜单中排名前列,性能超越Google Veo 3.1、OpenAI Sora 2等主流模型,支持文本、图像、视频、音频多模态精准控制,兼具专业级视频修复与全维度编辑能力,为音视
Seedance 2.0 Fast已接入即梦AI创作平台,是标准版的"极速模式"Seedance 2.0 Fast是字节跳动针对商业化批量生产场景推出的"效率优先"版本。它通过牺牲部分极致画质(1080p vs 2K)和物理精度,换取35倍的生成速度提升和更低的积分成本。
AIGC零基础入门到实战教程AIGC指利用人工智能技术(如大语言模型、图像生成模型等)自动或辅助生成文本、图像、音频、视频、代码等各类内容的技术与应用。
GitHub Copilot(VS Code版本)使用教程GitHub Copilot是由GitHub与OpenAI合作开发的AI编程助手,可深度集成于VS Code等主流编辑器,能实时为开发者提供代码生成、语法纠错、逻辑补全、注释撰写等智能辅助功能。
豆包MarsCode使用教程豆包MarsCode是字节跳动旗下豆包生态推出的一站式AI赋能编程解决方案,整合了智能编程辅助与轻量级开发环境两大核心能力,无需复杂配置即可快速上手。
夸克AI眼镜夸克AI眼镜用“热插拔换电+双目近眼显示+通义千问大模型”把导航、支付、拍摄、翻译、会议记录全部塞进36 g的普通眼镜里,是目前阿里生态整合度最高、续航最无焦虑的AI眼镜。
盘点亚马逊各国销售榜网址汇总亚马逊销售榜(Amazon Best Sellers Rank,简称BSR)是亚马逊平台为每个在售商品分配的实时销量排名,用于反映该商品在其所属类目中的相对销售表现。
Fruugo北美跨境电商平台(盘点Fruugo北美跨境电商登录网址)Fruugo是英国最大的本土跨境电商平台,支持全球46个国家销售,中国卖家入驻需满足跨境运营经验和商品资质要求,其中文官方译名为福禄购。下面小编给大家简单介绍一下Fruugo北美跨境电商平
Qwen3大模型系列合集,覆盖多个领域!今天给大家简单介绍阿里巴巴旗下最新的8大AI大模型,它们包括文本转语音模型、病毒基础大模型、同传大模型、视觉语言模型、安全防护模型等等!
打工人必备的4款办公室AI工具今天给大家简单介绍打工人必备的4款办公室AI工具:即梦AI绘画、绘梦PPT、飞书多维表格和夸克文档,下面AI工具站小编给大家简单介绍一下相关信息!
FastbuildAI:没有编程基础的用户也能零代码搭建原生AI应用FastbuildAI支持多种功能,包括AI对话、大语言模型、知识库管理、工作流编排、本地模型部署、多模态交互、超长上下文处理、OCR 模型、AI 搜索、应用市场等。
4款AI工具亲测,AI可视化工具/AI职业助手/AI浏览器/AI桌面助手今天给大家简单介绍一下4款AI办公工具,它们分别是AI办公可视化工具——可赞AI、AI职业助手——Indy AI、AI浏览器Agent平台——Asteroid AI和AI桌面助手——Cluely。
免费的远程桌面控制软件哪款好?RustDesk/向日葵/ToDesk/移动畅连/GameViewer远程监本文评测了5款免费远程桌面控制软件:RustDesk开源性强,适合技术用户;向日葵功能全面,适合家庭;ToDesk性能稳定,适合办公;移动畅连主打华为设备,无缝连接等。
AiPPT免费生成工具,支持一键生成ppt与自动创建大纲,支持小程序/手机网页访问AiPPT免费生成工具,一键生成与自动创建大纲,用户只需输入标题或主题,AI即可自动生成演示文稿的大纲和内容,简化创建过程。
花生AI:一款B站推出的帮助用户快速生成视频内容的AI视频创作工具花生AI是一款由B站推出的AI视频创作工具,花生AI能够在3分钟内生成完整的视频作品。用户只需提供文案或口播音频,AI会自动完成素材匹配、镜头切换与配音。
nFactorial:与世界顶尖专家的Zoom视频通话,为用户提供个性化教学nFactorial AI是一个创新的在线教育平台,通过与世界顶尖专家的Zoom视频通话,为用户提供个性化教学。用户可以与包括Paul Graham、Elon Musk、Terence Tao等在内的知名专家进行互动!
LinkMind:支持从TikTok、Instagram、YouTube等平台一键采集素材平台支持跨平台灵感采集,支持一键从TikTok、Instagram、YouTube等平台保存素材到灵感库,提供无水印下载、台词提取翻译等功能。
4款AI办公工具,包括AI表格数据处理/AI文档工具/AI原型设计工具等今天给大家介绍4款AI办公工具,AI表格数据处理——爱图表、AI文档工具——智写流程、AI效率提升——你好星识、AI原型设计工具——GemDesign。
PS5索尼网页版官方入口网址,附各地区官网PS5作为索尼旗下的新一代游戏主机,凭借其强大的性能和丰富的游戏阵容,在国内受到了众多玩家的喜爱。许多用户都对PS5官网的入口和功能感到好奇,接下来就为大家详细介绍。
夸克网盘网页版官方入口,附各端登录教程!夸克网盘网页版是阿里巴巴旗下夸克浏览器推出的一款智能云存储服务,完美适配各种浏览器和设备,包括手机、平板和电脑,支持Android、iOS、PC等平台,实现不同设备间的无缝切换。
Instagram网页版登录入口,一款在线图片以及视频分享平台Ins上汇聚了众多全球知名的明星和网红,用户可以通过关注他们,第一时间获取他们的最新动态。那么,Instagram网页版的入口在哪里呢?别着急,让我来为您详细介绍。
奈飞工厂免费Netflix影视资源的在线播放网址奈飞工厂客户端是一个致力于免费提供Netflix影剧动漫的流媒体播放平台,为用户提供了多种设备的客户端支持,方便用户随时随地观看高清影视内容。
推特Twitter网页版官网登录教程Twitter(现也称为“X”)是一款全球知名的社交媒体平台,提供多种产品和服务,满足不同用户的需求。
Discord网页版官方入口及注意事项Discord是一款多功能通讯软件,广泛应用于游戏、会议、课程等领域。它支持电脑端和移动端,电脑用户可直接通过官网在线使用。本文将为您介绍Discord官网入口,便于您轻松访问和使用。
奈飞Netflix免费账号注册中国网页版入口Netflix(奈飞)是全球领先的流媒体服务平台,提供丰富多样的影视内容,涵盖电影、电视剧、纪录片、动画等多种类型。以下是2025年一些热门的Netflix影视内容推荐!
ComfyUI设计的高级扩展工具ComfyUI-Advanced-ControlNet下载地址ComfyUI-Advanced-ControlNet为用户提供了一个强大的工具,以实现更复杂的图像生成和编辑任务。
FlowGram:字节跳动开源的一款强大的前端流程搭建工具FlowGram支持固定和自由布局,提供丰富的交互功能和高性能渲染。它适用于AI工作流、低代码平台和企业流程自动化,帮助开发者快速构建和优化流程化应用。
SuperEdit:字节团队和佛罗里达中央大学计算机视觉研究中心联合开发的一种新型SuperEdit 能够根据自然语言指令对图像进行精确编辑,支持全局场景变换(如将背景从森林变为雪景)、局部对象修改(如更换人物的服装或物品)等多种类型的编辑任务。
KuaiMod:快手推出的一款基于多模态大模型的短视频质量判别框架KuaiMod 是快手基于多模态大模型开发的智能审核框架,致力于高效识别和过滤暴力、色情、谣言等有害内容。
NoteLLM:小红书推出的一款针对笔记推荐的多模态大型语言模型框架NoteLLM是小红书推出的一款针对笔记推荐的多模态大型语言模型框架,旨在通过自然语言处理技术和大语言模型(LLM)的强大语义理解能力,提升笔记推荐的准确性和相关性。
MoBA:一款提高大型语言模型(LLMs)处理长上下文任务的效率MoBA(Mixture of Block Attention)是由 Moonshot AI 提出的一种新型注意力机制,旨在提高大型语言模型(LLMs)处理长上下文任务的效率。
ProtGPS:麻省理工(MIT)和西湖大学共同开发的蛋白质语言模型ProtGPS是一种基于深度学习的蛋白质语言模型,能够解析蛋白质序列中的化学代码,从而预测蛋白质在细胞内的特定位置。
UltraMem:字节旗下豆包大模型团队推出的一种稀疏模型架构UltraMem在推理速度上相比传统的Mixture of Experts(MoE)架构提升了2至6倍,同时将推理成本降低了最高达83%。
播记:上传播客音频,一键生成专业有趣的节目介绍播记自动生成包含节目主题、嘉宾介绍、重要观点、时间戳等内容的详细节目笔记。
ArcaNotes:一款AI增强型微型笔记应用ArcaNotes支持 iOS、Android、Windows 设备以及网页版,方便用户在不同设备上随时记录。
YAYI-Ultra:中科闻歌研发的企业级大语言模型YAYI-Ultra具备强大的多领域专业能力和多模态内容生成能力,支持数学、代码、金融、舆情、中医、安全等多个领域的专家组合。
PDF to Podcast:一款可以将 PDF 文档转换为生动的音频内容AI工具PDF to Podcast可以将学术论文、研究报告等 PDF 文档转换为音频播客,便于在通勤、运动等场景下收听和学习。
HUGWBC:上海交大和上海人工智能实验室联合开发的通用人形机器人控制器HUGWBC(Humanoid’s Unified and General Whole-Body Controller)是一种用于人形机器人精细运动控制的统一通用全身控制器。
InspireMusic:阿里巴巴通义实验室推出的一款开源音乐生成工具包InspireMusic 适合研究人员、开发者以及音乐爱好者使用,无论是进行学术研究、产品开发,还是简单地创作个性化音乐,都能满足需求。
VisoMaster:一款功能强大且易于使用的 AI 换脸和编辑软件VisoMaster 适合普通用户和专业人士使用,无论是想要创建有趣的娱乐内容,还是进行专业的视觉特效制作,都能提供高效、便捷的解决方案。
FlashVideo:字节跳动与香港大学联合推出的一款高分辨率视频生成框架FlashVideo 的高效性和高质量视频生成能力使其成为视频生成领域的有力工具,尤其适合需要快速生成高质量视频内容的用户和企业。
ACE++:阿里巴巴开源的新一代 AI 图像生成与编辑框架ACE++ 支持多种图像生成和编辑任务,包括角色一致性迁移、局部编辑、虚拟试穿等。
DeepSeek使用渠道和实战技巧大盘点今天给大家简单介绍DeepSeek使用渠道的三个工具,它们分别是gpt4all、Ollama和AnythingLLM。
2025年1月中文版AI工具流量排行榜top50序号 名称 月访问量 说明 1 UI-TARS 5.03m UI-TARS 是一个用于自动化图形用户界面交互的下一代原生 GUI 代理模型。 2 Hunyuan3D 2.0 5.03m Hunyuan3D 2.0 是腾讯推出的高分辨率 3D 资产生成系统,基于大规模扩
2025年1月全球AI工具流量排行榜top25排名 AI工具名称 月访问量(单位:百万) 说明 1 Radar 47.16 生产力工具,监控关键词和趋势。 2 ChatGPT 38.50 智能对话助手,提供个性化服务和解决方案。 3 Microsoft Bing 18.38 生产力工具,提供问题
2025年1月国内AI工具流量排行榜TOP50排名 AI工具名称 网站 流量(单位:万) 1 夸克 www.quark.cn 7770.25 2 DeepSeek chat.deepseek.com 22500.00 3 豆包 www.doubao.com 3456.99 4 Kimi智能助手 kimi.moonshot.cn 3281.52 5 文心一言 yiyan.baidu.com 1448.41 6 百度AI助手
LLaVA-Rad:微软开发的新型小型多模态模型,专注于高级临床放射学报告的生成该模型在包含697,435个图像-报告对的数据集上进行了训练,展示了卓越的性能。
Goku:香港大学与字节跳动合作推出的一款AI视频生成模型Goku是一款功能强大且具有广泛应用前景的AI视频生成模型,其在生成效率、成本控制以及输出质量方面均展现了显著优势。
AI酱:一款能够直接通过语音与AI对话的应用AI酱是一款二次元风格的多语言智能聊天应用,用户可以通过语音与AI角色进行实时对话。
Fish Speech:一款开源文本转语音(TTS)工具Fish Speech支持多种语言(包括中文、英文、日文等),并具备强大的语音合成能力。
PromptPort:专为人工智能大模型设计的创意工具平台平台提供了丰富的提示词库,用户可以根据需求直接使用或进行创作和优化。PromptPort 的目标是通过优化提示词,提升大模型的响应质量和内容创作的效率。
Seed-TTS:字节跳动开发的高质量、多功能的文本到语音(TTS)模型Seed-TTS 是由字节跳动开发的一系列高质量、多功能的文本到语音(TTS)模型,旨在生成与人类语音极为相似的语音。
CosyVoice 2.0:阿里巴巴通义实验室开发的先进流式语音合成模型CosyVoice 2.0 通过其强大的功能和灵活的应用场景,为语音合成领域带来了新的突破和可能性。
深度解读:清华大学DeepSeek从入门到精通,技术达人的进阶手册(附PDF文件)清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室精心编写的《DeepSeek从入门到精通》PDF文件,为初学者和进阶用户提供了全面、系统的学习路径。
NutWorld:将日常单目视频高效地转换为动态3D高斯的新型视频处理框架NutWorld 通过其创新的动态3D高斯表示和高效的单次前向传播,为单目视频处理领域带来了新的突破,展现出强大的多功能性和实用性。
EliGen:浙大和阿里联合开发的新型实体级可控图像生成框架EliGen 包含50万高质量注释样本的数据集,用于训练模型以实现鲁棒且准确的实体级操控。此外,EliGen 提出了修复融合管道,能扩展到多实体图像修复任务。
Hibiki:一款由Kyutai开发的实时同声传译语音模型Hibiki是一款功能强大且实用的实时语音翻译模型,其高效、低延迟和跨平台的特点使其在多种场景中具有广泛的应用潜力。
FireRedASR:小红书开发的工业级自动语音识别(ASR)模型FireRedASR 是由小红书 FireRed 团队开发并开源的一系列工业级自动语音识别(ASR)模型,专为普通话、中文方言和英语设计。
StochSync:一款360°全景图和3D网格纹理StochSync 是一种创新的生成模型,该模型特别适用于生成具有复杂几何结构的空间,例如360度全景图像和网格表面用于纹理映射。
Splash:一个专注于 AI 音乐创作与互动体验的创新平台SplashMusic是一款基于人工智能技术的音乐创作工具,旨在简化音乐制作过程,使用户能够轻松地生成高质量的音乐作品。
鲸喷 DeepRant:一款专为游戏玩家设计的多语言快捷翻译工具鲸喷 DeepRant 是一款专为游戏玩家设计的实用工具,能够有效解决跨语言交流的问题,提升游戏体验。
MUSIC.AI:一个集音乐创作、音频处理和数据分析于一体的综合性平台MUSIC.AI支持多种 AI 工具的无缝集成,用户可以根据需求灵活调整工作流程。
UI-TARS:字节跳动开发的一种新型 GUI 代理模型UI-TARS是由字节跳动推出的一款新一代原生GUI代理模型,旨在通过自然语言实现对桌面、移动设备和网页界面的自动化交互。
Hunyuan3D 2.0:腾讯推出的一种先进大规模 3D 合成系统腾讯推出的一款革命性的大规模3D合成系统,旨在生成高分辨率、纹理化的3D资产。该系统通过先进的AI技术,将图像或文本描述快速转化为高质量的3D模型,显著提升了3D内容创作的效率和质量
Kimi k1.5:MoonshotAI 开发的多模态语言模型Kimi K1.5是一款集多模态处理、高效推理和开源特性于一体的高性能AI模型,其在多个领域均超越了国际顶尖模型,标志着中国AI技术的重大突破。
DeepSeek-R1-Zero:一款由DeepSeek团队开发的推理模型DeepSeek-R1-Zero模型跳过了传统AI训练中依赖大量标注数据的步骤,直接通过RL算法进行训练,展示了强化学习在复杂推理任务中的潜力。
MimicPhoto:快速、轻松地完善照片中的面部特征,生成自然逼真的图像– AI照片编辑工具,能快速调整笑容、眼神等面部表情细节
TabTac:专注于通过人工智能技术提升用户的搜索、网页浏览和办公效率TabTac是一款集成了强大AI功能的浏览器,不仅提升了搜索、浏览和办公效率,还注重隐私保护和用户体验。其去中心化加密技术和对Web3.0的支持使其在当前的浏览器市场中具有独特优势。
MeloLab平台整合AI混音、翻唱、人声分离、母带制作等专业功能,搭配在线多轨编辑器,实现音乐作品全流程线上制作。
小叮当影院主打在线影视观看,片库资源齐全,覆盖电影、剧集、综艺、动漫等多元内容。
音乐库核心操作简单易懂,支持关键词搜歌;平台不支持手动创建歌单,可使用官方推荐歌单,也可导入外部歌单补足曲目管理需求。
CodeGateway产品定位:稳定、便捷、企业级的模型调用基础设施,帮开发者专注 AI 创新、无需对接多厂商。
Agnes AI核心文本、图像、视频API无限期免费开放,同时提供付费Token套餐,适配测试、开发与生产部署全场景。
Pixmax AI整合多款主流AI模型、复用式工作流、创意模板与素材资产管理功能。
ProfessionalHeadshot.io可在15-30分钟内产出40-100张工作室级职业头像,适配职场社交平台、简历、企业官网、高管介绍等场景。
CinLink用户只需输入文字指令,即可完成剪辑、字幕、翻译、配音、生成素材等全套媒体任务。
VidTranslate AI视频翻译工具一款AI驱动的视频编辑工具,依托顶尖多模态AI技术,可结合画面场景与上下文实现高水准翻译,大幅简化视频多语言转译流程。
Therly AI全天候在线的匿名AI心理服务平台,结合CBT、ACT疗法与正念练习,无需预约即可随时为用户疏导情绪、梳理思绪、缓解焦虑。