Goethe übernimmt den das Versmaß der Vorlage, also von Herders Übersetzung »Erlkönigs Tochter«: Es ist ein vierhebiger Vers mit Mittelzäsur, männlich kadenzierten Paarreimen und frei kadenzierendem ersten Halbvers. Prinzipiell besteht Füllungsfreiheit, auch der Auftakt kann einfach oder doppelt sein oder wegfallen. Das große Maß an Flexibilität erlaubt es, Regelmäßigkeiten zu etablieren und Abweichungen davon für bestimmte Ausdruckszwecke zu nutzen. Die jambische Variante mit weiblicher Kadenz im ersten Halbvers (xXxXx | xXxX) etabliert sich in der ersten Strophe als so etwas wie die Null-Variante. Gehäufte Doppelsenkungen können als gesteigerte Bewegungsdynamik oder gesteigerte Dramatik der Interaktion gesehen werden – aber auch, bei entsprechend monotoner Realisierung (und + trochäisches Verb), als gleichmäßiges Einwiegen.
Besonders auffällig sind die Destabilisierungen der Verssymmetrie durch eine Schwächung oder Verschiebung der Zäsur – dies betrifft vor allem die Reden des Vaters (Vers 5, 8), wenn er die Verdoppelung in der Anrede (oder sonst eine Verdoppelung am Anfang) noch nicht übernommen hat.
Nur der Erlkönig benutzt den Doppelauftakt (»Meine«), nur das Kind hat auftaktlose Verse (»Erlkönig« oder »Erlkönigs« – beide kann man leicht doch auf der zweiten Silbe betonen).
Ansonsten arbeitet der Dichter mit Vokalreihen, die eine bestimmte Bedeutung erhalten. Am deutlichsten ist dies der lange I-Vokal in den Reden des Erlkönigs, die überhaupt dank mehrerer Wiederholungsfiguren einen besonderen Wohlklang erhalten.
Der Stil ist volkstümlich schlicht. In der ganzen Ballade findet sich keine einzige Metapher, kein einziger Vergleich. Die poetische Arbeit liegt ganz auf der Ebene des Rhythmus, des Klanges und der motivischen Verkettung.