登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
我知道了
查看详情
登录
注册
代码拉取完成,页面将自动刷新
开源项目
>
人工智能
>
AI-人工智能
&&
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
44
Star
167
Fork
510
Ascend
/
mstt
代码
Issues
1
Pull Requests
180
Wiki
统计
流水线
服务
Gitee Pages
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
我知道了,不再自动展开
307
【Bugfix】【问题单】【ptdbg】修复溢出检测存盘数据路径名已存在时报错的问题,并增加autojudge开关
已关闭
jiwei:master
Ascend:master
jiwei
创建于 2023-10-27 11:46
克隆/下载
HTTPS
SSH
复制
下载 Email Patch
下载 Diff 文件
【问题描述】 多次跑同一个模型,每次检出溢出后算子的前向数据都保存到同一目录forward_real_data下。且文件名都由算子命名,若溢出算子相同,检测到之前跑模型产生的同名文件已存在的话会报错退出。 报错退出 【方案描述】 1.在PrecisionDebugger.configure_hook中增加一个开关autojudge(默认关闭),用于控制检测到溢出后是否dump下溢出算子的前向数据。 2.在路径名中增加时间戳,精确到秒,用来区别每次dump数据的路径。 例如: 原路径./model/resnet/forward_real_data/rank0/Tensor___add___1_forward.0.npy 修改后./model/resnet/forward_real_data_20231027_052416/rank0/Tensor___add___1_forward.0.npy 【自验证信息】 1.测试autojudge开关是否能控制数据是否dump。 - 开关默认关闭,产生溢出,但前向数据未落盘   - 将开关打开,检测到溢出后,产生落盘文件,   2.测试多次跑模型检测到溢出时落盘文件路径是否会产生冲突 - 多次跑一个模型,每次检测到溢出时产生data文件的目录带时间戳,不会报路径重复的错误,并且forward_info_*.json中保存的数据路径和真实路径保持一致。   - 冒烟  - UT 
此 Pull Request 无法自动合并
尝试通过 WebIDE 解决冲突
怎样手动合并此 Pull Request
git checkout master
git pull https://gitee.com/ji-wei1024/att.git master
git push origin master
评论
13
提交
1
文件
70
检查
代码问题
0
批量操作
展开设置
折叠设置
审查
Code Owner
审查人员
wuyulong17
wuyulong11
沃文杰
wo-wenjie
zhaozepeng
zhaozepeng
MooYeh
mooyeh
李天
litian_drinksnow
188******92
sunboquan
周先琪
zhou-xianqi
jiangchangting1
jiangchangting1
梅飞要
mei-feiyao
panyj1993
panyj1993
wangkaizju
wangkaizju
Do丶
wangshiling_yxg
HuiYu
monaleila
liangchaoming
aerfaliang
李斌
jsez-li-bin
penxie
xiepeng20
裘凯达
cudi
user_10012209
cai-weiwei1989
yinglinwei
roger-comeon
吴瑞
curry3
liupengcheng
leo920320
i-robot
I-am-a-robot
AtlasAccount
atlasaccount
端明亮
brightlyking
wangchao
wangchao285
hekunkun
kun_8
姚晗
yaohan404
feng123www
feng123www
uniteone
uniteone
HuaweiAscend
HUAWEI-ASCEND_admin
未设置
最少人数
0
测试
wuyulong17
wuyulong11
沃文杰
wo-wenjie
zhaozepeng
zhaozepeng
MooYeh
mooyeh
李天
litian_drinksnow
188******92
sunboquan
周先琪
zhou-xianqi
jiangchangting1
jiangchangting1
梅飞要
mei-feiyao
panyj1993
panyj1993
wangkaizju
wangkaizju
Do丶
wangshiling_yxg
HuiYu
monaleila
liangchaoming
aerfaliang
李斌
jsez-li-bin
penxie
xiepeng20
裘凯达
cudi
user_10012209
cai-weiwei1989
yinglinwei
roger-comeon
吴瑞
curry3
liupengcheng
leo920320
i-robot
I-am-a-robot
AtlasAccount
atlasaccount
端明亮
brightlyking
wangchao
wangchao285
hekunkun
kun_8
姚晗
yaohan404
feng123www
feng123www
uniteone
uniteone
HuaweiAscend
HUAWEI-ASCEND_admin
未设置
最少人数
0
优先级
不指定
严重
主要
次要
不重要
标签
ascend-cla/yes
关联 Issue
未关联
Pull Request 合并后将关闭上述关联 Issue
里程碑
未关联里程碑
参与者
(3)
Cherry-pick 提交
Cherry-pick 可以将
特定提交(Commit)
从某个分支挑选并应用到另一个分支,实现快速集成特定更改,而无需合并整个分支。
请选择应用 Cherry-pick 提交 (Commit) 的目标分支
新建分支
当前账号不存在 Fork 仓库,建议 cherry-pick 到 Fork 仓库。
Fork 仓库
提交列表
Commit SHA
Commit Message
基于 Cherry-pick 后的分支发起 Pull Request
取消
Cherry-pick
Python
1
https://gitee.com/ascend/mstt.git
git@gitee.com:ascend/mstt.git
ascend
mstt
mstt
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
评论
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册