On Convergence and Generalization of Dropout Training

published by Poorya Mianjy in 2020 in Informatics Engineering and research's language is English Download

Abstract in English

We study dropout in two-layer neural networks with rectified linear unit (ReLU) activations. Under mild overparametrization and assuming that the limiting kernel can separate the data distribution with a positive margin, we show that dropout training with logistic loss achieves $epsilon$-suboptimality in test error in $O(1/epsilon)$ iterations.

Download