Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

paddleocr模型训练 #12110

Closed
Darren0465 opened this issue May 13, 2024 · 2 comments
Closed

paddleocr模型训练 #12110

Darren0465 opened this issue May 13, 2024 · 2 comments
Assignees

Comments

@Darren0465
Copy link

paddleocr模型训练中用了预训练模型,但训练前期的acc为零,是否正常

@GreatV
Copy link
Collaborator

GreatV commented May 14, 2024

如果在训练初期阶段发现准确率(accuracy, 简称 acc)为零,这可能是正常现象,也可能是存在一些需要注意的问题。

  1. 正常现象:在训练的最初几个epoch,模型可能还没有开始有效学习,特别是当训练集非常大或者模型结构较为复杂时。此时,模型输出的结果可能完全是随机的,导致准确率非常低或接近于零。随着训练的进行,准确率应该会逐渐提高。

  2. 潜在问题

    • 数据预处理问题:检查数据是否被正确预处理和加载。错误的数据处理会导致模型无法从数据中学习有效信息。
    • 模型配置问题:检查模型的配置是否正确,包括是否正确加载了预训练模型的权重。如果预训练模型的权重没有被正确加载,也可能会影响模型的表现。
    • 学习率设置:过高或过低的学习率都可能导致模型在训练初期表现不佳。
    • 标签错误:确认训练数据的标签是否准确。错误的标签会直接影响训练效果。

建议的做法是:

  • 检查日志和输出:查看训练过程中的日志输出,确认是否有错误或警告信息。
  • 可视化训练过程:如果可能,使用如 wandb 这类工具来观察准确率和损失函数的变化,帮助诊断问题。
  • 小批量测试:先使用小批量数据进行训练,看是否能够正常学习和提高准确率。
  • 参数调整:尝试调整学习率或其他训练参数,看是否有改善。

@UserWangZz
Copy link
Collaborator

感谢回复

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

4 participants