登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
登录
注册
代码拉取完成,页面将自动刷新
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
3
Star
2
Fork
12
ODTC AI Infra
/
GPUCodeForces
代码
Issues
6
Pull Requests
1
Wiki
统计
流水线
服务
JavaDoc
PHPDoc
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
我知道了,不再自动展开
更新失败,请稍后重试!
移除标识
内容风险标识
本任务被
标识为内容中包含有代码安全 Bug 、隐私泄露等敏感信息,仓库外成员不可访问
[task]: 002-example
待办的
#ICXA2D
阔海生
成员
创建于
2025-09-10 11:59
### 这个任务是否已经存在? - [x] 我已经搜索过现有的任务 (https://gitee.com/ccf-ai-infra/GPUCodeForces/issues) ### 如何实现 1. 新建了一个example 2. 区别于001-example,使用了swish算子 --siwsh算子: 1. 计算更简单: •Swish = x * sigmoid(x) •仅需指数运算和乘法,比GeLU简单 •更容易实现且更少出现精度问题 2.精度保障措施: •使用PyTorch内置的x * torch.sigmoid(x)作为基准 •添加详细的误差分析(最大误差和平均误差) •设置严格的误差阈值(最大误差<0.0001) •添加GPU预热步骤,避免初始运行影响精度 3.性能优化: •每个线程仅处理一个元素,避免复杂计算 •使用高效的sigmoid实现(1/(1+exp(-x))) •保持256线程块大小,平衡并行效率 •在性能测试前添加GPU预热步骤 ### 完成目标的预期效果 精度对齐验证: 精度对齐:最大误差0.000000,平均误差0.000000 性能加速比测试: PyTorch内置Swish平均执行时间:0.000037秒 自定义cUDASwish平均执行时间:0.000052秒 加速比(Speedup):0.72x ### 目标的验收方式如何 通过提交后的测试结果验证 ### 其它背景材料 [在这里上传背景材料及图片]
### 这个任务是否已经存在? - [x] 我已经搜索过现有的任务 (https://gitee.com/ccf-ai-infra/GPUCodeForces/issues) ### 如何实现 1. 新建了一个example 2. 区别于001-example,使用了swish算子 --siwsh算子: 1. 计算更简单: •Swish = x * sigmoid(x) •仅需指数运算和乘法,比GeLU简单 •更容易实现且更少出现精度问题 2.精度保障措施: •使用PyTorch内置的x * torch.sigmoid(x)作为基准 •添加详细的误差分析(最大误差和平均误差) •设置严格的误差阈值(最大误差<0.0001) •添加GPU预热步骤,避免初始运行影响精度 3.性能优化: •每个线程仅处理一个元素,避免复杂计算 •使用高效的sigmoid实现(1/(1+exp(-x))) •保持256线程块大小,平衡并行效率 •在性能测试前添加GPU预热步骤 ### 完成目标的预期效果 精度对齐验证: 精度对齐:最大误差0.000000,平均误差0.000000 性能加速比测试: PyTorch内置Swish平均执行时间:0.000037秒 自定义cUDASwish平均执行时间:0.000052秒 加速比(Speedup):0.72x ### 目标的验收方式如何 通过提交后的测试结果验证 ### 其它背景材料 [在这里上传背景材料及图片]
评论 (
0
)
登录
后才可以发表评论
状态
待办的
待办的
进行中
已完成
已关闭
负责人
未设置
标签
未设置
标签管理
里程碑
未关联里程碑
未关联里程碑
Pull Requests
未关联
未关联
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
未关联
未关联
main
开始日期   -   截止日期
-
置顶选项
不置顶
置顶等级:高
置顶等级:中
置顶等级:低
优先级
不指定
严重
主要
次要
不重要
参与者(1)
1
https://gitee.com/ccf-ai-infra/GPUCodeForces.git
git@gitee.com:ccf-ai-infra/GPUCodeForces.git
ccf-ai-infra
GPUCodeForces
GPUCodeForces
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
评论
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册