парсинг html

Нужно было парсить html, потратил полдня потом узнал что на друпале html и xml вообще парсить нельзя. Библиотека которой парсится html использует кучу функций, а друпал некоторые функции php переписал под свои нужды от того оно и не пашет на страницах..

Вижу 2 выхода:
-переделать html в json и парсить его.
-тупо фрейм)

Может кто сталкивался с таким? Какие решения есть?

RSS-материал RSS-материал