别再浪费时间试图获得 1000 次观看,却不知道到底该怎么做。
在这篇文章里,我会介绍如何逆向拆解一个爆款格式,以及如何通过几个简单步骤创建一个 AI 网红来复刻它。
我最近一直很懒,但发现这个方法真的超级简单。
说实话?
如果你还不知道怎么做出爆款内容,这篇文章可能就是你唯一需要的,因为我会从头到尾讲清楚整个流程。
你需要什么?
既然我们要创建 AI 网红,你只需要这个流程:
Gemini -> GPT Image 2 -> Seedance 2.0
(我会用 Arcads 来让一切更简单、更快速)。
我会解释为什么需要这些工具,以及如何使用它们。
我们要创建什么?
我每天刷视频长达 3 小时,因为我的整个账号基本上就是一个应用和营销创意的数据库,所以我经常能找到爆款格式,然后在 X 上分享。
昨天我发现了这个账号:
annastepsy
1294 个粉丝,7 个视频,超过 900 万次观看。

但我为什么要给你看这个账号?
- 这是一个全新的账号
- 我们完全可以借鉴他们的格式
- 这是一个超级逼真的 AI 网红(而且人们根本分辨不出来)
这是该账号最爆的一个视频:

780 万次观看,130 万个赞
我们要在复刻之前分析这个视频的每一帧,但具体怎么做呢?
第一步:用 Gemini 分析视频
我不知道为什么,但很多人仍然没有意识到,你可以直接把一个 TikTok 视频发给 Gemini,让它分析:
- 逐帧分析
- 钩子
- 节奏
- 动作
- 基本上视频里的一切
这就是我用来研究竞争对手的爆款格式,并将其应用到我的应用中的方法。
工作流程如下:
- 下载 TikTok 视频(你可以直接从平台下载)
- 把这段提示词发给 Gemini
我希望你从头到尾分析这个 TikTok 视频,不要包含水印或任何 TikTok 界面元素。给我以下信息:1. 节奏 2. 女孩的外貌特征 3. 非常详细的逐帧动作描述 4. 她使用的文字钩子 5. 她使用的视觉钩子
我们会用到提取出的每一条信息,读完这篇文章你就会明白为什么。
在这个案例中,Gemini 返回了以下内容:
以下是该视频的分解:1. 节奏 视频节奏非常快,能量很高。它从一个即时的动态动作开始,并在高潮(摔倒)发生时突然切断。没有铺垫或缓慢的积累,营造出一种突然混乱的效果。2. 女孩的外貌特征 女孩有一头金发,扎成马尾辫。她穿着一件亮红色、紧身的长袖运动上衣。她似乎身处夜晚的户外环境,衣服被雨水浸透,在人造路灯下闪闪发光。3. 逐帧动作描述 0:00–0:01 → 手持摇晃的慢跑镜头 0:02 → 身体开始失去平衡 0:03 → 惊慌反应 + 试图恢复 0:04 → 完全向前摔倒 0:05 → 撞击瞬间切断 4. 文字钩子 “当我的手机在我达到 3000 步之前不让我解锁 TT 或 Ins,而人行道突然决定这是我的死期。”5. 视觉钩子 极端天气 + 混乱能量 + 突然摔倒。
如你所见,这基本上就是免费的市场调研。
你不再需要猜测了。
你是在逆向工程注意力。
第二步:创建 AI 网红
现在,我们将使用 Gemini 提取的外貌特征作为基础提示词。
我只需要添加一些额外的细节,比如:
- 手持 TikTok 自拍的感觉
- 逼真的糟糕光线
- 运动模糊
- 低质量 iPhone 的感觉
因为完美并不等于爆款。
你可以直接复制粘贴这段提示词:
一段手持 TikTok 风格的自拍视频,一个金发女孩在夜晚的雨中奔跑,用手机前置摄像头拍摄。她湿漉漉的金发扎成凌乱的马尾辫,发丝贴在脸上。她穿着一件紧身的亮红色长袖运动上衣,被雨水浸透,在模糊的路灯下闪闪发光。画面感觉原始而自然,带有轻微的运动模糊、摇晃的镜头、不均匀的构图、自动对焦的搜索、压缩伪影、低光噪点,以及偶尔从经过的灯光中产生的过曝高光。她一边跑一边喘着粗气,微微笑着,充满活力和混乱。整体氛围是真实的深夜 TikTok 自拍素材——不完美、随意、有电影感但画质低,就像在雨中快速奔跑穿过城市时匆忙录制的。
你也可以让 Gemini 改进这样的提示词。
直接告诉它:
“让它感觉像真实的 iPhone 自拍,光线差,画面摇晃”
这通常就足够了。
我会把这个提示词粘贴到 Arcads 中,使用 GPT Image 2,格式为 16:9。
看看这些惊人的结果:

现在我们已经有了 AI 网红,可以进入最重要的部分了。
实际的视频。
第三步:创建 TikTok 视频
嗯,严格来说,我们已经在研究中获得了完整的提示词结构。
但我还是会把所有内容粘贴到 Gemini 中,让它增强:
- 动作的真实感
- 节奏
- 视频质量
- 镜头的不完美
因为细节才是让你真正爆火的关键。
以下是我在 Arcads 上使用 Seedance 2.0 时用的提示词:
竖屏 TikTok 风格自拍视频,混乱且极度真实,由一位金发运动型女孩在夜晚暴风雨中户外奔跑时用 iPhone 前置摄像头拍摄。整个片段感觉像是偶然、自发且情绪冲动的——就像一次拍摄完成的真实爆款 TikTok。女孩湿漉漉的金发扎成凌乱的马尾辫,浸湿的发丝贴在脸上和额头上。她穿着一件亮红色、紧身的长袖运动上衣,被雨水浸湿后变得有光泽且反光。在刺眼的路灯下,她的皮肤湿漉漉、亮闪闪。大雨倾盆而下,她奔跑在夜晚黑暗的郊区街道上。摄像头完全是手持自拍视角,手臂伸直,一边冲刺一边拍摄。构图不断变化,不完美:有时离脸太近,有时切掉部分头部或肩膀。0:00–0:01 — 她一边笑着喘气,一边快速跑向镜头,眼睛睁大,肾上腺素飙升,在笑声中语无伦次地说话或尖叫。0:02 — 她的脚突然在湿滑的人行道上打滑。她的表情瞬间从欢乐的混乱变成真正的恐慌。0:03 — 她开始向右重重摔倒。手机迅速向下倾斜,但镜头仍然对着她的脸。0:04 — 完全失去平衡。运动模糊变得极其严重。0:05 — 突然的撞击瞬间。摄像头几乎砸到地面,视频立即切断。视觉风格:- 真实的 TikTok 能量 - 不完美的 iPhone 前置摄像头画面 - 低光手机噪点 - 逼真的雨水物理效果 - 凌乱的构图 - 剧烈的手持晃动 - 电影感但偶然的感觉 - 原始的爆款 TikTok 氛围 - 突然的结尾
结果如下:
如你所见,作为视觉钩子,这简直完美。
人们会立刻停止滑动,因为大脑检测到了:
- 动作
- 混乱
- 情绪
- 危险
- 喜剧
所有这些都在第一秒内。
第四步:上传到 TikTok
现在我们已经有了所有内容,你可以直接从 TikTok 中添加提取到的钩子。
是的:
只使用 TikTok 本身的钩子,不要用外部平台的。
以下是我会如何预热账号:
- 预热大约 2 天
- 搜索你所在领域的视频
- 每天评论 2 次
- 完整观看视频,而不是无脑刷
- 表现得像个真人
就这样。
人们把预热这件事搞得太复杂了。
我个人会怎么做
我可能会把这个当作一个低成本的格式来用。
我甚至不会在钩子里直接提到应用名称。
我只会提到:
- 描述里
- 评论里
- 置顶回复里
为什么?
因为这种格式通过好奇心起作用。
人们在观看后自然会去评论区,因为这种格式触发了天生的滑稽感和困惑感。
那他们会在那里找到什么?
你的应用名称
这就是为什么它效果这么好。
另一件我会做的事:
我可能会稍微降低画质,让它更可信。
不要上传超高清 4K IMAX 电影级的 AI 视频,因为人们一眼就能看出来。
不完美才是让内容感觉真实的关键。
结语
我想感谢每一位读完这篇文章的人。
我真的很享受写这些内容,因为我终于可以分享我最近实际在做的事情,而不是什么都藏着掖着。
还要非常感谢 Arcads 赞助了这篇内容,让这一切成为可能。





