Spaces:

lidiiakarmanova
/

exam-evaluator

Sleeping

exam-evaluator / analyze_results.py

KarmanovaLidiia

Initial clean commit for HF Space (models via Git LFS)

bcb314a about 1 month ago

19 kB

	import pandas as pd
	import matplotlib.pyplot as plt
	from collections import Counter
	import numpy as np
	import os
	import warnings

	warnings.filterwarnings('ignore')

	# Настройка отображения
	plt.style.use('default')
	plt.rcParams['font.family'] = 'DejaVu Sans' # Для поддержки кириллицы


	def load_and_analyze_data():
	"""Загрузка и базовый анализ данных"""

	# Загрузка данных с правильным разделителем
	file_path = 'small.csv' # или полный путь к файлу

	# Пробуем разные разделители и кодировки
	try:
	# Сначала пробуем с разделителем точка с запятой
	df = pd.read_csv(file_path, encoding='utf-8', delimiter=';')
	print("✅ Файл загружен с разделителем ';' и кодировкой utf-8")
	except:
	try:
	df = pd.read_csv(file_path, encoding='cp1251', delimiter=';')
	print("✅ Файл загружен с разделителем ';' и кодировкой cp1251")
	except:
	try:
	df = pd.read_csv(file_path, encoding='utf-8', delimiter=',')
	print("✅ Файл загружен с разделителем ',' и кодировкой utf-8")
	except:
	try:
	df = pd.read_csv(file_path, encoding='cp1251', delimiter=',')
	print("✅ Файл загружен с разделителем ',' и кодировкой cp1251")
	except Exception as e:
	print(f"❌ Ошибка загрузки файла: {e}")
	return None

	print("=" * 60)
	print("АНАЛИЗ РЕЗУЛЬТАТОВ АВТОМАТИЧЕСКОЙ ОЦЕНКИ")
	print("=" * 60)

	# Базовая информация о данных
	print(f"Размер данных: {df.shape[0]} строк, {df.shape[1]} колонок")
	print(f"\nВсе колонки: {list(df.columns)}")

	# Показываем первые несколько строк для проверки
	print(f"\nПервые 3 строки данных:")
	print(df.head(3))

	return df


	def check_and_rename_columns(df):
	"""Проверка и переименование колонок если нужно"""

	print("\n" + "=" * 40)
	print("ПРОВЕРКА СТРУКТУРЫ ДАННЫХ")
	print("=" * 40)

	# Если есть только одна колонка, возможно данные объединены
	if df.shape[1] == 1:
	first_column = df.columns[0]
	print(f"Обнаружена одна колонка: '{first_column}'")

	# Проверяем, содержит ли она все данные
	sample_value = str(df.iloc[0, 0])
	if ';' in sample_value:
	print("⚠️ Данные объединены в одну колонку, разделяем...")

	# Разделяем данные по точке с запятой
	split_data = df[first_column].str.split(';', expand=True)

	# Берем первую строку как заголовки
	if split_data.shape[0] > 1:
	new_columns = split_data.iloc[0].tolist()
	split_data = split_data[1:] # Убираем строку с заголовками
	split_data.columns = new_columns
	df = split_data.reset_index(drop=True)
	print("✅ Данные успешно разделены")
	print(f"Новые колонки: {list(df.columns)}")

	return df


	def basic_statistics(df):
	"""Базовая статистика по оценкам"""

	print("\n" + "=" * 40)
	print("БАЗОВАЯ СТАТИСТИКА")
	print("=" * 40)

	# Проверяем наличие нужных колонок
	available_columns = list(df.columns)
	print(f"Доступные колонки: {available_columns}")

	# Статистика по AI оценкам (pred_score)
	if 'pred_score' in df.columns:
	print("\nAI оценки (pred_score):")
	print(f" Среднее: {df['pred_score'].mean():.3f}")
	print(f" Медиана: {df['pred_score'].median():.3f}")
	print(f" Стандартное отклонение: {df['pred_score'].std():.3f}")
	print(f" Минимум: {df['pred_score'].min():.3f}")
	print(f" Максимум: {df['pred_score'].max():.3f}")
	else:
	print("❌ Колонка 'pred_score' не найдена")

	# Статистика по человеческим оценкам
	human_score_columns = ['Оценка экзаменатора', 'оценка', 'score', 'human_score']
	human_score_col = None

	for col in human_score_columns:
	if col in df.columns:
	human_score_col = col
	break

	if human_score_col:
	print(f"\nОценки экзаменатора ({human_score_col}):")
	print(f" Среднее: {df[human_score_col].mean():.3f}")
	print(f" Медиана: {df[human_score_col].median():.3f}")
	print(f" Стандартное отклонение: {df[human_score_col].std():.3f}")

	# Распределение оценок
	print(f"\nРаспределение оценок экзаменатора:")
	распределение = df[human_score_col].value_counts().sort_index()
	for оценка, count in распределение.items():
	print(f" {оценка}: {count} ответов ({count / len(df) * 100:.1f}%)")
	else:
	print("❌ Колонка с оценками экзаменатора не найдена")


	def calculate_correlations(df):
	"""Расчет корреляций и разниц"""

	print("\n" + "=" * 40)
	print("КОРРЕЛЯЦИИ И РАСХОЖДЕНИЯ")
	print("=" * 40)

	# Проверяем наличие обеих колонок
	if 'pred_score' not in df.columns:
	print("❌ Колонка 'pred_score' не найдена для расчета корреляций")
	return

	human_score_columns = ['Оценка экзаменатора', 'оценка', 'score', 'human_score']
	human_score_col = None

	for col in human_score_columns:
	if col in df.columns:
	human_score_col = col
	break

	if not human_score_col:
	print("❌ Колонка с оценками экзаменатора не найдена для расчета корреляций")
	return

	# Корреляция
	correlation = df[[human_score_col, 'pred_score']].corr().iloc[0, 1]
	print(f"Корреляция между оценками: {correlation:.3f}")

	# Разницы между оценками
	df['разница'] = df['pred_score'] - df[human_score_col]
	df['abs_разница'] = abs(df['разница'])

	print(f"\nСредняя абсолютная разница: {df['abs_разница'].mean():.3f}")
	print(f"Максимальная разница: {df['abs_разница'].max():.3f}")
	print(f"Минимальная разница: {df['abs_разница'].min():.3f}")

	# Анализ согласованности
	print("\nСОГЛАСОВАННОСТЬ ОЦЕНОК:")
	for порог in [0.1, 0.3, 0.5, 1.0]:
	согласованные = df[df['abs_разница'] < порог].shape[0]
	процент = (согласованные / len(df)) * 100
	print(f" Разница < {порог}: {согласованные} ответов ({процент:.1f}%)")

	# Направление разниц
	завышение = len(df[df['разница'] > 0])
	занижение = len(df[df['разница'] < 0])
	совпадение = len(df[df['разница'] == 0])

	print(f"\nНАПРАВЛЕНИЕ РАЗНИЦ:")
	print(f" AI завышает: {завышение} ({завышение / len(df) * 100:.1f}%)")
	print(f" AI занижает: {занижение} ({занижение / len(df) * 100:.1f}%)")
	print(f" Полное совпадение: {совпадение} ({совпадение / len(df) * 100:.1f}%)")


	def create_visualizations(df):
	"""Создание визуализаций"""

	print("\n" + "=" * 40)
	print("СОЗДАНИЕ ВИЗУАЛИЗАЦИЙ")
	print("=" * 40)

	# Проверяем наличие нужных колонок
	if 'pred_score' not in df.columns:
	print("❌ Колонка 'pred_score' не найдена для визуализации")
	return

	human_score_columns = ['Оценка экзаменатора', 'оценка', 'score', 'human_score']
	human_score_col = None

	for col in human_score_columns:
	if col in df.columns:
	human_score_col = col
	break

	if not human_score_col:
	print("❌ Колонка с оценками экзаменатора не найдена для визуализации")
	return

	# Создаем папку для графиков
	os.makedirs('graphs', exist_ok=True)

	# 1. Scatter plot сравнения оценок
	plt.figure(figsize=(12, 8))
	scatter = plt.scatter(df[human_score_col], df['pred_score'],
	c=df['abs_разница'], cmap='viridis', alpha=0.7, s=80)
	plt.colorbar(scatter, label='Абсолютная разница')

	# Определяем диапазон для линии идеального соответствия
	min_val = min(df[human_score_col].min(), df['pred_score'].min())
	max_val = max(df[human_score_col].max(), df['pred_score'].max())
	plt.plot([min_val, max_val], [min_val, max_val], 'r--', alpha=0.5, label='Идеальное соответствие')

	plt.xlabel(f'Оценка экзаменатора ({human_score_col})', fontsize=12)
	plt.ylabel('AI оценка (pred_score)', fontsize=12)
	plt.title('Сравнение человеческой и AI оценки\n(цвет показывает величину расхождения)', fontsize=14)
	plt.legend()
	plt.grid(True, alpha=0.3)
	plt.savefig('graphs/scatter_comparison.png', dpi=300, bbox_inches='tight')
	plt.close()

	# 2. Гистограмма разниц
	plt.figure(figsize=(12, 6))
	n, bins, patches = plt.hist(df['разница'], bins=30, alpha=0.7,
	edgecolor='black', color='skyblue')
	plt.xlabel('Разница оценок (AI - Человек)', fontsize=12)
	plt.ylabel('Количество ответов', fontsize=12)
	plt.title('Распределение разниц между AI и человеческими оценками', fontsize=14)
	plt.grid(True, alpha=0.3)
	plt.axvline(x=0, color='red', linestyle='--', alpha=0.8, linewidth=2, label='Нулевая разница')
	plt.axvline(x=df['разница'].mean(), color='orange', linestyle='--',
	alpha=0.8, linewidth=2, label=f'Средняя разница: {df["разница"].mean():.3f}')
	plt.legend()
	plt.savefig('graphs/difference_histogram.png', dpi=300, bbox_inches='tight')
	plt.close()

	print("✅ Графики сохранены в папку 'graphs/'")


	def analyze_extreme_cases(df):
	"""Анализ крайних случаев"""

	print("\n" + "=" * 40)
	print("АНАЛИЗ КРАЙНИХ СЛУЧАЕВ")
	print("=" * 40)

	if 'abs_разница' not in df.columns:
	print("❌ Не найдены данные о разницах оценок")
	return

	human_score_columns = ['Оценка экзаменатора', 'оценка', 'score', 'human_score']
	human_score_col = None

	for col in human_score_columns:
	if col in df.columns:
	human_score_col = col
	break

	if not human_score_col:
	print("❌ Колонка с оценками экзаменатора не найдена")
	return

	# Наибольшие расхождения
	большие_расхождения = df.nlargest(8, 'abs_разница')[
	[human_score_col, 'pred_score', 'abs_разница', 'разница']
	]

	# Добавляем ID если есть
	id_columns = ['Id экзамена', 'id', 'ID', 'exam_id']
	for col in id_columns:
	if col in df.columns:
	большие_расхождения[col] = df.loc[большие_расхождения.index, col]
	break

	question_columns = ['№ вопроса', 'question', 'вопрос', 'question_id']
	for col in question_columns:
	if col in df.columns:
	большие_расхождения[col] = df.loc[большие_расхождения.index, col]
	break

	print("Топ-8 наибольших расхождений:")
	print("-" * 80)
	for idx, row in большие_расхождения.iterrows():
	направление = "ЗАВЫШЕНИЕ" if row['разница'] > 0 else "ЗАНИЖЕНИЕ"

	# Формируем информацию об ID и вопросе
	id_info = ""
	if 'Id экзамена' in row:
	id_info = f"Экзамен {row['Id экзамена']}"
	elif 'id' in row:
	id_info = f"ID {row['id']}"

	question_info = ""
	if '№ вопроса' in row:
	question_info = f", Вопрос {row['№ вопроса']}"
	elif 'question' in row:
	question_info = f", Вопрос {row['question']}"

	print(f"\n📊 {id_info}{question_info} ({направление}):")
	print(f" 👤 Человек: {row[human_score_col]} \| 🤖 AI: {row['pred_score']:.3f}")
	print(f" 📏 Разница: {row['abs_разница']:.3f} ({row['разница']:+.3f})")
	print("-" * 60)


	def analyze_explanations(df):
	"""Анализ объяснений оценок"""

	print("\n" + "=" * 40)
	print("АНАЛИЗ ОБЪЯСНЕНИЙ ОЦЕНОК")
	print("=" * 40)

	explanation_columns = ['объяснение_оценки', 'explanation', 'объяснение', 'комментарий']
	explanation_col = None

	for col in explanation_columns:
	if col in df.columns:
	explanation_col = col
	break

	if not explanation_col:
	print("❌ Колонка с объяснениями оценок не найдена")
	return

	# Собираем все объяснения
	все_объяснения = ' '.join(df[explanation_col].dropna().astype(str))

	# Разбиваем на слова и фильтруем
	слова = [word.strip() for word in все_объяснения.split() if len(word.strip()) > 2]

	# Анализ частотности
	частотность = Counter(слова)

	print("Топ-15 наиболее частых характеристик в объяснениях:")
	print("-" * 50)
	for слово, count in частотность.most_common(15):
	print(f" {слово}: {count}")


	def save_detailed_analysis(df):
	"""Сохранение детального анализа в файл"""

	print("\n" + "=" * 40)
	print("СОХРАНЕНИЕ РЕЗУЛЬТАТОВ")
	print("=" * 40)

	if 'abs_разница' not in df.columns:
	print("❌ Нет данных для детального анализа")
	return

	# Создаем копию с анализом
	df_analysis = df.copy()

	human_score_columns = ['Оценка экзаменатора', 'оценка', 'score', 'human_score']
	human_score_col = None

	for col in human_score_columns:
	if col in df.columns:
	human_score_col = col
	break

	if human_score_col and 'pred_score' in df.columns:
	df_analysis['разница_ai_человек'] = df_analysis['pred_score'] - df_analysis[human_score_col]
	df_analysis['abs_разница'] = abs(df_analysis['разница_ai_человек'])

	# Добавляем категоризацию расхождений
	условия = [
	df_analysis['abs_разница'] < 0.1,
	df_analysis['abs_разница'] < 0.3,
	df_analysis['abs_разница'] < 0.5,
	df_analysis['abs_разница'] >= 0.5
	]
	категории = ['Отличное', 'Хорошее', 'Умеренное', 'Низкое']
	df_analysis['качество_согласования'] = np.select(условия, категории, default='Низкое')

	# Сортируем по наибольшим расхождениям
	df_analysis = df_analysis.sort_values('abs_разница', ascending=False)

	try:
	# Сохраняем в Excel
	with pd.ExcelWriter('detailed_analysis.xlsx', engine='openpyxl') as writer:
	# Все данные
	df_analysis.to_excel(writer, sheet_name='Все_данные_с_анализом', index=False)
	print("✅ Детальный анализ сохранен в 'detailed_analysis.xlsx'")

	except Exception as e:
	print(f"⚠️ Не удалось сохранить Excel, сохраняем в CSV: {e}")
	df_analysis.to_csv('detailed_analysis.csv', index=False, encoding='utf-8')
	print("✅ Детальный анализ сохранен в 'detailed_analysis.csv'")


	def main():
	"""Основная функция"""

	try:
	# Загрузка данных
	df = load_and_analyze_data()

	if df is None:
	return

	# Проверка и корректировка структуры данных
	df = check_and_rename_columns(df)

	# Выполнение анализа
	basic_statistics(df)
	calculate_correlations(df)
	create_visualizations(df)
	analyze_extreme_cases(df)
	analyze_explanations(df)
	save_detailed_analysis(df)

	print("\n" + "=" * 60)
	print("✅ АНАЛИЗ ЗАВЕРШЕН!")
	print("=" * 60)

	except FileNotFoundError:
	print("❌ ОШИБКА: Файл 'small.csv' не найден в текущей директории")
	print(" Убедитесь, что файл находится в той же папке, что и скрипт")
	except Exception as e:
	print(f"❌ ОШИБКА при выполнении анализа: {str(e)}")
	import traceback
	traceback.print_exc()


	if __name__ == "__main__":
	main()