Debugging ML Models

Common Issues

High train, low test accuracy? → Overfitting

Low train, low test accuracy? → Underfitting

Perfect accuracy on validation? → Data leakage

Check: features from future, test data in training, target encoding before split

High variance? → Model too complex or small dataset High bias? → Model too simple

Interview Q: "Test acc 99%, train acc 60%. What's wrong?" A: Data leakage. Test performance shouldn't exceed training.

:::