Io penserei innanzitutto ad un linguaggio lato server e non lato client allo scopo.
Guarda qui:
http://www.w3schools.com/site/site_validate.asp
W3Schools rimandano direttamente al sito del W3C. Se non ci riescono loro:
1. non c'è soluzione;
2. è troppo complessa e non ne vale la pena.
La soluzione ci sarebbe dal mio puntodi vista: basterebbe accedere al sorgente HTML con XMLHTTP, scremare tutto il codice e, con delle espressioni regolari, verificareche i tag siano chiusi, che ci siano le intestazioni e cosi via.
Non so se chiederei meno di 30.000 euro per fare una cosa del genere
Ti conviene perderci tanto tempo?