Сообщения

Сообщения за май, 2024

ПРАКТИЧЕСКОЕ ЗАДАНИЕ №6. SENTIMENT ANALYSIS В СОЦИАЛЬНЫХ МЕДИА

Изображение
 Для анализа я решила взять три социальные сети: Инстаграм, Фэйсбук и ВКонтакте.  ИНСТАГРАМ  1. У инстаграма 51 позитивное упоминание, 46 негативных и 347 нейтральных.  2. Разницы между фото и видео практически нет. Фото 141, видео 146, а ссылок 137. 3. Третий столбец ключевых слов наиболее важен, так как в первом и втором больше предлогов.  ФЭЙСБУК 1. У Фэйсбука 100 позитивных упоминаний, 44 негативных и 350 нейтральных.  2. Видео (197) чуть больше чем фото (127), а ссылок всего 157. 3. Опять же третий столбец более информативный, так как в остальных упоминаются в основном предлоги.  ВКОНТАКТЕ 1. У ВК больше нейтральных упоминаний (411). Позитивных 17, а негативных 10. 2. Опять же разница между видео (129) и фото (155) незначительная. А ссылок здесь 137. 3. Здесь я бы выделила второй столбец с ключевыми словами, так как запросы более точные.  Таким образом, можно сделать вывод, что три социальные сети мало чем отличаются. В большинстве о них нейт...

ПРАКТИЧЕСКОЕ ЗАДАНИЕ №8. СТРУКТУРНЫЙ SENTIMENT АНАЛИЗ ИНФОРМАЦИИ С МОДЕЛЯМИ MDS, ACM И ОЦЕНКОЙ ДИСПЕРСИИ

Изображение
 В качестве анализа я выбрала статью о наркотической зависимости, в которой рассказывается о её видах и последствиях.  Из MDS-модели можно выявить, что текст скорее негативный. В большей степени выделяются такие цвета как зелёный, синий и фиолетовый. На зелёной области можно увидеть слова, которые относятся к видам зависимости, поэтому эту часть можно назвать нейтральной. А вот на синей и фиолетовой части выделяются уже более эмоционально-окрашенные слова, которые критикую наркотическую зависимость.  Доминирующая тональность показывает, что в тексте выделяются практически все стороны тональности. Я с этим согласна, так как текст на самом деле достаточно разнообразен в этом ключе.  Карта эмоциональных полей разделила абзацы на несколько частей: общая информация о наркотиках, виды зависимости, последствия.  Таблица распределила эмоции по абзацам. По ней видно, что эмоциональный фон не сильно меняется на протяжении текста.  Таким образом, несмотря на то, что с...

ПРАКТИЧЕСКОЕ ЗАДАНИЕ №7. SENTIMENT-АНАЛИЗ ТЕКСТА

Изображение
 Для анализа я взяла статью о наркотической зависимости. В ней рассказывается о видах зависимости и последствиях употребления наркотиков.  По схеме видно, что в данном тексте преобладает позитивная тональность. Я думаю, это связано с тем, что в самом тексте нет критики наркотической зависимости, а лишь приводятся конкретные факты о ней.  Слова разделились на несколько групп. От наиболее позитивной к наиболее негативной. Под жёлтым цветом можно увидеть слово "доза", далее мы переходим к зелёному, где есть такие слова как "развивается", "система", "наркотический" и тд. Фиолетовым цветом выделены такие слова как "ломка", " эффект". К менее негативным словам модель отнесла повествование о видах зависимости, а вот тему последствия наркотиков она уже отнесла к наиболее негативной тональности. 

ПРАКТИЧЕСКОЕ ЗАДАНИЕ №5. КЛАСТЕРНЫЙ АНАЛИЗ ИЗ ВНЕШНЕЙ БАЗЫ ДАННЫХ

Изображение
 Я взяла ключевое слово «Ukrainе» за период от 24.02.22 до 27.02.22 а) связаны тексты с совпадающими цветными полями - что их на ваш взгляд объединяет? Да, тексты связаны с цветными полями. Каждый цвет выделяет определённую тематику. Например, голубым обозначены мировые новости. Здесь в основном обсуждается вторжение России в Украину и помощь от других стран. Приложение очень полезно: оно не только находит нужные новости по ключевым словам, но и делит их на конкретные секции.  б) связаны тексты с общими линиями пересечений?  У меня получилось достаточно большое количество линий пересечений. Все эти линии объединяют одну тему – вторжение Российских войск в Украину. 

ПРАКТИЧЕСКОЕ ЗАДАНИЕ №4. АВТОМАТИЗИРОВАННЫЙ КЛАСТЕРНЫЙ АНАЛИЗ

Изображение
 Я использовала тексты про Стивена Спилберга. Они включают его биографию, анализ фильмов, интервью, критические статьи и статьи о его влиянии на киноиндустрию. Тексты разделились на две группы. Я считаю, что три текста больше посвящены биографии Спилберга, а два других анализируют его фильмы, стиль режиссуры, влияние на кинематограф, а также его творческое наследие. Именно поэтому статьи разбились именно на такое количество групп.  Число групп по общности текстов при изменении уровня кластеризации меняется в большую сторону. 

ПРАКТИЧЕСКОЕ ЗАДАНИЕ №3. АВТОМАТИЗИРОВАННЫЙ КОНТЕНТ-АНАЛИЗ С МОДЕЛЬЮ ТЕКСТА

Изображение
Для анализа я взяла пять текстов, в которых говорится о биографии Стивена Спилберга, его заслугах, творчестве и карьере.  Обе модели, по моему мнению, справились с поставленной задачей. Они выделили ключевые слова из текстов. Word Cloud сделал достаточно обширный анализ, но из-за этого его использование не очень удобно, так как он выделяет много лишней информации. Topic modeling же наоборот обозначил только важные темы, избегая ненужных слов.  Таким образом, лично для меня удобнее использовать Topic modeling, так как он предоставляет конкретную информацию без лишней воды, а также удобнее читается. 

ПРАКТИЧЕСКОЕ ЗАДАНИЕ №2. АВТОМАТИЗИРОВАННЫЙ КОНТЕНТ-АНАЛИЗ

Изображение
 Для анализа я выбрала два схожих текста о правилах по уходу за кошками. Но по ключевым словам можно выявить, что основной посыл текстов различается.  В первой статье выделяются такие слова, как: изолированный, комната, переноска, адаптация, окно. Из чего можно сделать вывод, что речь идёт о создании безопасной среды для котёнка.  Во второй статье выделяются такие слова, как: уши, зубы, уход, стричь, воспаление и т.п. Это означает, что текст больше посвящён гигиене и поддержанию здоровья кошек.  Таким образом, оба текста посвящены правилам по уходу за кошками, но в первом тексте упор делается на создание безопасной атмосферы для котят, а во втором на поддержание гигиены.  1. 2.