Звуки видимого мира и музыка формируются в два параллельных ряда. Все диегетические звуки (топот копыт или деревенская чечетка под комсомольскую польку) подчеркнуто асинхронны, искусственны, они усиливают эффект условности звука. <...>

В фильме <...> почти постоянно слышны музыка и пение. Гармонь, «поэзия советских деревень» — не только в центре сюжета этого фильма, но и ее условно-фольклорный звуковой фон: рифмованные реплики как бы возникают из песен и частушек. Х. Херсонский в своей рецензии обращает внимание именно на это обстоятельство:

«Рискованная попытка заставить людей не говорить, а почти все время петь, притом среди реальных, а не условных берез, изб, столов, сделана актерами без фальши. Режиссер сумел каждый раз найти музыкальные и ритмические оправдания для возникновения на экране песни». 

Режиссер М. Дубсон высоко оценил именно «исключительную ритмичность, блестящее сочетание звука и света, лиричности и монтажа». И действительно: ритм стихов и длина строк поэмы А. Жарова вместе с музыкой С. Потоцкого задают ритм монтажа. Ритмически-музыкальная сторона играет ведущую роль в этом фильме, в котором группа девушек соревнуется с женским хором, а борьба между кулаками и комсомольцами происходит в виде состязания в (симультанном) пении: веселая гармонь Тимошки побеждает «заунывный» кулацкий романс о березке. «Гармонь» со своим автономным звуковым рядом с порой довольно отрывистым монтажом — весьма оригинальный русский музыкальный фильм или, точнее, «лирическая кино-поэма» (как вслед за Херсонским обозначили жанр фильма современные критики), в которой музыка и стихи доминируют над изображением. <...>

ДРУБЕК-МАЙЕР Н. Звуки музыки. (Анти-)медиум в советских музыкальных комедиях // Советская власть и медиа. Спб., 2006