有没有办法能让 ai 自进化,例如实现下面这个需求 我需要使用 playwright-cli + playwright skills 对一个程序进行测试 我告诉他需要测试这个页面或者说爬取某些数据 假设这个平台为 B 站然后我需要获取 B 站热搜条目的前十个视频的链接
第一次 通过语义识别并自动保存为 skills 或者脚本
第二次 相同目标直接运行该 Skill 并对每次操作进行综合评分并计算总评分
第三次 运行 skills 或者脚本 如果出现意外情况 需要降级到下面
实现: 如果出现错误的操作 重新实现操作 如果存在更优秀的操作 记录该操作 如果出现没必要的操作就删除该操作
统计分析: 完成后重新计算每步评分和总评分并判断是否需要更新 Skill
错误回滚: 无法完成该步骤 就会回滚 到该步骤评分最高方法 如果还无法完成 就会回滚 总评分最高的 skills
主要实现目标 Skill 复用 执行过程评分 反馈优化 Skill 失败回滚 + 策略选择 自我进化
期望是 能支持本地 cli 直接调用 例如 使用 claude -p "/playwright-cli xxxx" 去安全沙盒执行同时支持多种 cli 做出来的 skill 需要支持版本管理 和 可复用 跨平台使用 这里会使用到 多 skills 怎么让他读取完全部上下文而不丢失 实现持久化对话 和 支持 给 skills 扩充功能 需要返沪数据提取并持久化 支持定时任务 去执行某个任务
1
johnsun0821 1 天前
|
2
Zephyrrr2333 1 天前
这段视频介绍了 TanStack AI Code Mode ,一种优化应用中 LLM 工具调用的新方式。传统的工具调用方法往往效率不高,导致上下文占用高,并且需要多次往返服务器( 0:00 - 1:56 )。 Code Mode 的主要特性包括: **基于 TypeScript 的执行:** Code Mode 不再强制让 LLM 直接调用工具,而是让 LLM 生成 TypeScript 代码,然后在隔离环境中执行( 2:03 - 2:36 )。对于数据处理和计算这类任务,这种方式明显更快,也更准确( 2:38 - 3:14 )。 **性能提升:** 视频展示了在执行复杂任务(例如计算产品的平均成本)时,LLM 调用次数大幅减少(从 4 次降到 2 次),上下文使用量也显著下降(从 9.8KB 降到 1.7KB )( 2:38 - 2:50 )。 **Code Mode Skills:** 这一功能允许 LLM 保存并复用它生成过的有价值代码片段,把它们转化为可重复使用的技能。对于重复性任务,这会进一步提升性能( 4:35 - 5:43 )。 **广泛的能力:** Code Mode 可以与多种后端集成,包括数据库,用于生成 SQL 和动态 UI 组件,从而动态处理复杂的报表任务( 5:48 - 7:10 )。 Jack Herrington 鼓励开发者克隆 TanStack AI 的 monorepo ,亲自探索这些功能,包括数据库集成和动态 UI 示例( 7:13 - 7:40 )。 |