Алгоритм анализа текста
☑
0
odines
18.09.15
✎
13:51
Есть таблица
колонки
слово1...слово16
строки
дым стол бум играть...
т.е. это таблица с текстом. Слова любые, могут повторяться.
Задачи:
- подсчитать сколько всего разных слов в таблице
- подсчитать кол-во вхождений каждого слова в таблице
подскажите алгоритм, может быть ссылку на реализацию в других языках.
кол-во колонок ограничено, тупо свернуть по всем колонкам и потом вычислять перебором кажется громоздко...
1
ДенисЧ
18.09.15
✎
13:54
Выбрать слово, количество(Слово) из (
выбрать колонка1 как слово
объединить все
выбрать колонка2 как слово
...
) как т
сгруппировать по слово
2
Живой Ископаемый
18.09.15
✎
13:55
а что, слово может повторяться только в разных строках в одной колонке? В одной строке в разных колонках не может?
И в разных строках и разных колонках?
если может, то хоть досворачивайся, никак не посчитаешь.
3
Живой Ископаемый
18.09.15
✎
13:56
2(1) годно
4
odines
18.09.15
✎
14:15
(2) слово может повторяться где угодно, представьте что текст из книжки засунули в таблицу из 16 колонок...
(1) спасибо попробую
5
JeyRico
18.09.15
✎
14:21
Можно поискать в архиве лекториума, в курсе по алгоритмам, про анализ текстов тоже есть.
Независимо от того, куда вы едете — это в гору и против ветра!