style=\"padding-bottom:40px\">\n <div style=\"font-size: 10pt; \"><p dir=\"ltr\" style=\"margin-top:0;margin-bottom:0;\">patest</p><p dir=\"ltr\" style=\"margin-top:0;margin-bottom:0;\"><br></p><div id=\"SignatureBox\" dir=\"ltr\" style=\"margin-top:0;margin-bottom:0;\">Отправлено с телефона LG</div></div>\n\n\n</body></html>');
to_tsvector
—---------------------------------------------------------------------------------------------------------------------------------------------
—---------------------------------------------------------------------------------------------------------------------------------------------
—-------------------------------------------------------------------------------------------------------------------------
'0':26,30,39,43,53,57 '10pt':18 '40px':11 'bodi':6 'bottom':10,29,42,56 'dir':20,33,47 'div':13,44 'font':16 'font-siz':15 'id':45 'lg':61 'lt
r':21,34,48 'margin':24,28,37,41,51,55 'margin-bottom':27,40,54 'margin-top':23,36,50 'n':1,2,3,4,5,12,62,63,64 'p':19,32 'pad':9 'padding-bott
om':8 'patest':31 'signaturebox':46 'size':17 'style':7,14,22,35,49 'top':25,38,52 'отправл':58 'телефон':60
(1 row)`
Стандартный парсер PostgreSQL не умеет парсить html
Давно хотели написать html-parser для FTS, да руки не дошли. А так, надо написать свою функцию на plpython или plperl и просто to_tsvector(html2text(........))
Обсуждают сегодня