WIP: test #2
4
migration/course_migration.sql
Normal file
4
migration/course_migration.sql
Normal file
@@ -0,0 +1,4 @@
|
|||||||
|
INSERT INTO pet_project.courses (course_id, title, category, created_at) VALUES
|
||||||
|
(1, 'SQL для начинающих', 'data', '2023-01-01 00:00:00'),
|
||||||
|
(2, 'Python для анализа данных', 'programming', '2023-01-15 00:00:00'),
|
||||||
|
(3, 'BI с нуля', 'business', '2023-03-01 00:00:00');
|
||||||
6
migration/enrollments_migration.sql
Normal file
6
migration/enrollments_migration.sql
Normal file
@@ -0,0 +1,6 @@
|
|||||||
|
INSERT INTO pet_project.enrollments (id, user_id, course_id, enrolled_at) VALUES
|
||||||
|
(1, 1, 1, '2023-01-15'),
|
||||||
|
(2, 1, 2, '2023-02-01'),
|
||||||
|
(3, 2, 1, '2023-01-20'),
|
||||||
|
(4, 3, 2, '2023-03-05'),
|
||||||
|
(5, 4, 3, '2023-04-01');
|
||||||
7
migration/fact_lessons_view.sql
Normal file
7
migration/fact_lessons_view.sql
Normal file
@@ -0,0 +1,7 @@
|
|||||||
|
INSERT INTO pet_project.fact_lesson_views (id, user_id, lesson_id, viewed_at) VALUES
|
||||||
|
(1, 1, 1, '2023-01-16 10:00:00'),
|
||||||
|
(2, 1, 2, '2023-01-16 10:15:00'),
|
||||||
|
(3, 2, 1, '2023-01-21 09:00:00'),
|
||||||
|
(4, 3, 3, '2023-03-06 12:00:00'),
|
||||||
|
(5, 4, 4, '2023-04-02 10:00:00'),
|
||||||
|
(6, 4, 5, '2023-04-03 10:00:00');
|
||||||
6
migration/lessons_migration.sql
Normal file
6
migration/lessons_migration.sql
Normal file
@@ -0,0 +1,6 @@
|
|||||||
|
INSERT INTO pet_project.lessons (lesson_id, course_id, title, duration_min) VALUES
|
||||||
|
(1, 1, 'SELECT и FROM', 10),
|
||||||
|
(2, 1, 'JOIN', 15),
|
||||||
|
(3, 2, 'Pandas', 20),
|
||||||
|
(4, 3, 'Основы BI', 12),
|
||||||
|
(5, 3, 'Метрики и дашборды', 18);
|
||||||
6
migration/users_migration.sql
Normal file
6
migration/users_migration.sql
Normal file
@@ -0,0 +1,6 @@
|
|||||||
|
INSERT INTO pet_project.users (user_id, name, age, email, registration_date) VALUES
|
||||||
|
(1, 'Alice', 25, 'alice@mail.com', '2023-01-10 00:00:00'),
|
||||||
|
(2, 'Bob', 30, 'bob@gmail.com', '2023-02-05 00:00:00'),
|
||||||
|
(3, 'Charlie', 22, 'charlie@mail.com', '2023-02-20 00:00:00'),
|
||||||
|
(4, 'Diana', 28, 'diana@mail.com', '2023-03-01 00:00:00'),
|
||||||
|
(5, 'Ethan', 35, 'ethan@gmail.com', '2023-03-10 00:00:00');
|
||||||
47
queries/analize.sql
Normal file
47
queries/analize.sql
Normal file
@@ -0,0 +1,47 @@
|
|||||||
|
-- ### ✅ **Задание 5: Напиши SQL-запросы к витринам**
|
||||||
|
-- **Напиши свои вариации для практики.**
|
||||||
|
-- 📌 *Ниже — примеры.*
|
||||||
|
-- ### Топ-5 самых просматриваемых уроков
|
||||||
|
-- SELECT
|
||||||
|
-- lesson_title,
|
||||||
|
-- course_title,
|
||||||
|
-- total_views
|
||||||
|
-- FROM lesson_popularity_summary
|
||||||
|
-- ORDER BY total_views DESC
|
||||||
|
-- LIMIT 5;
|
||||||
|
SELECT *
|
||||||
|
FROM (
|
||||||
|
SELECT * FROM pet_project.mv_lesson_popularity_summary
|
||||||
|
) AS top_lessons
|
||||||
|
LIMIT 5
|
||||||
|
;
|
||||||
|
|
||||||
|
WITH selected_top AS (SELECT *
|
||||||
|
FROM pet_project.mv_lesson_popularity_summary)
|
||||||
|
SELECT *
|
||||||
|
FROM selected_top
|
||||||
|
LIMIT 5
|
||||||
|
;
|
||||||
|
|
||||||
|
|
||||||
|
-- ### Неактивные пользователи, записавшиеся на курсы
|
||||||
|
-- SELECT
|
||||||
|
-- name,
|
||||||
|
-- email,
|
||||||
|
-- registered_courses_count
|
||||||
|
-- FROM inactive_users_summary
|
||||||
|
-- WHERE registered_courses_count > 0
|
||||||
|
-- ORDER BY registration_date DESC;
|
||||||
|
|
||||||
|
-- дальше по аналогии как ВЫШЕ, подзапрос или CTE
|
||||||
|
|
||||||
|
-- ### Курсы с самым высоким процентом завершения
|
||||||
|
-- SELECT
|
||||||
|
-- course_title,
|
||||||
|
-- AVG(completion_rate) AS avg_completion
|
||||||
|
-- FROM course_completion_rate
|
||||||
|
-- GROUP BY course_title
|
||||||
|
-- ORDER BY avg_completion DESC
|
||||||
|
-- LIMIT 5;
|
||||||
|
|
||||||
|
-- дальше по аналогии как ВЫШЕ, подзапрос или CTE
|
||||||
59
queries/course_completion_rate.sql
Normal file
59
queries/course_completion_rate.sql
Normal file
@@ -0,0 +1,59 @@
|
|||||||
|
-- ### ✅ **Задание 4: Создай витрину `course_completion_rate`**
|
||||||
|
--
|
||||||
|
-- **Цель:** проанализировать, насколько хорошо пользователи проходят курсы.
|
||||||
|
--
|
||||||
|
-- 📌 **Что нужно сделать:**
|
||||||
|
--
|
||||||
|
-- - Сформируй таблицу, где строка — это пользователь + курс.
|
||||||
|
-- - Для каждой пары нужно рассчитать:
|
||||||
|
-- - Общее число уроков в курсе
|
||||||
|
-- - Сколько из них просмотрел конкретный пользователь
|
||||||
|
-- - Коэффициент завершения (`lessons_viewed / lessons_in_course`)
|
||||||
|
--
|
||||||
|
-- **Как использовать метрику:**
|
||||||
|
--
|
||||||
|
-- Можно анализировать, какие курсы чаще всего "бросают", какие хорошо проходят, где стоит улучшить структуру или добавить мотивационные механики (геймификация, рассылки и т.п.).
|
||||||
|
WITH course_lesson AS (SELECT course_id, count() AS total_lessons
|
||||||
|
FROM pet_project.lessons
|
||||||
|
GROUP BY course_id)
|
||||||
|
SELECT concat(u.name, ', ', c.title) AS user_course,
|
||||||
|
any(cl.total_lessons) AS lessons_in_course,
|
||||||
|
count(DISTINCT flv.lesson_id) AS lessons_viewed,
|
||||||
|
round(count(DISTINCT flv.lesson_id) / any(cl.total_lessons), 2) AS coef
|
||||||
|
FROM pet_project.users u
|
||||||
|
JOIN pet_project.fact_lesson_views flv ON flv.user_id = u.user_id
|
||||||
|
JOIN pet_project.lessons l ON l.lesson_id = flv.lesson_id
|
||||||
|
JOIN pet_project.courses c ON c.course_id = l.course_id
|
||||||
|
JOIN course_lesson cl ON cl.course_id = l.course_id
|
||||||
|
GROUP BY u.name, c.title
|
||||||
|
ORDER BY user_course
|
||||||
|
;
|
||||||
|
|
||||||
|
-- создание mat view
|
||||||
|
CREATE MATERIALIZED VIEW pet_project.mv_user_course_progress
|
||||||
|
ENGINE = SummingMergeTree(lessons_viewed)
|
||||||
|
ORDER BY (user_id, course_id)
|
||||||
|
POPULATE
|
||||||
|
AS
|
||||||
|
SELECT flv.user_id AS user_id,
|
||||||
|
l.course_id AS course_id,
|
||||||
|
any(u.name) AS user_name,
|
||||||
|
any(c.title) AS course_title,
|
||||||
|
any(cl.total_lessons) AS lessons_in_course,
|
||||||
|
count(DISTINCT flv.lesson_id) AS lessons_viewed,
|
||||||
|
round(count(DISTINCT flv.lesson_id) / any(cl.total_lessons), 2) AS coef
|
||||||
|
FROM pet_project.fact_lesson_views flv
|
||||||
|
JOIN pet_project.users u ON u.user_id = flv.user_id
|
||||||
|
JOIN pet_project.lessons l ON l.lesson_id = flv.lesson_id
|
||||||
|
JOIN pet_project.courses c ON c.course_id = l.course_id
|
||||||
|
JOIN (
|
||||||
|
SELECT course_id, count() AS total_lessons
|
||||||
|
FROM pet_project.lessons
|
||||||
|
GROUP BY course_id
|
||||||
|
) cl ON cl.course_id = l.course_id
|
||||||
|
GROUP BY flv.user_id, l.course_id
|
||||||
|
;
|
||||||
|
|
||||||
|
SELECT *
|
||||||
|
FROM pet_project.mv_user_course_progress
|
||||||
|
;
|
||||||
43
queries/inactive_users_summary.sql
Normal file
43
queries/inactive_users_summary.sql
Normal file
@@ -0,0 +1,43 @@
|
|||||||
|
-- ### ✅ **Задание 3: Создай витрину `inactive_users_summary`**
|
||||||
|
--
|
||||||
|
-- **Цель:** выявить пользователей, которые **зарегистрировались, но ничего не посмотрели**.
|
||||||
|
--
|
||||||
|
-- 📌 **Что нужно сделать:**
|
||||||
|
--
|
||||||
|
-- - Подготовь таблицу, где каждая строка — один такой "неактивный" пользователь.
|
||||||
|
-- - Для каждого пользователя нужны:
|
||||||
|
-- - ID, имя, email, возраст
|
||||||
|
-- - Количество курсов, на которые он записался
|
||||||
|
-- - Дата регистрации
|
||||||
|
-- **Где пригодится:**
|
||||||
|
--
|
||||||
|
-- Эта витрина может использоваться для продуктовой аналитики, триггерных рассылок (например, напоминаний), анализа оттока, повышения вовлечённости.
|
||||||
|
SELECT u.user_id AS user_id,
|
||||||
|
any(u.name) AS user_name,
|
||||||
|
any(u.email) AS email,
|
||||||
|
any(u.age) AS age,
|
||||||
|
count() course_count,
|
||||||
|
any(u.registration_date) AS registration_date
|
||||||
|
FROM pet_project.users u
|
||||||
|
LEFT JOIN pet_project.enrollments e USING (user_id)
|
||||||
|
GROUP BY u.user_id
|
||||||
|
ORDER BY u.user_id
|
||||||
|
;
|
||||||
|
|
||||||
|
-- Создание вьюшки
|
||||||
|
CREATE MATERIALIZED VIEW pet_project.mv_inactive_users_summary
|
||||||
|
REFRESH every 1 day
|
||||||
|
ENGINE SummingMergeTree()
|
||||||
|
ORDER BY (user_id)
|
||||||
|
AS
|
||||||
|
SELECT u.user_id AS user_id,
|
||||||
|
any(u.name) AS user_name,
|
||||||
|
any(u.email) AS email,
|
||||||
|
any(u.age) AS age,
|
||||||
|
count() course_count,
|
||||||
|
any(u.registration_date) AS registration_date
|
||||||
|
FROM pet_project.users u
|
||||||
|
LEFT JOIN pet_project.enrollments e USING (user_id)
|
||||||
|
GROUP BY u.user_id;
|
||||||
|
-- проверка
|
||||||
|
SELECT * FROM pet_project.mv_inactive_users_summary;
|
||||||
49
queries/lesson_popularity_summary.sql
Normal file
49
queries/lesson_popularity_summary.sql
Normal file
@@ -0,0 +1,49 @@
|
|||||||
|
-- ### ✅ **Задание 2: Подготовь структуру витрины `lesson_popularity_summary`**
|
||||||
|
--
|
||||||
|
-- **Цель:** анализировать популярность каждого урока.
|
||||||
|
--
|
||||||
|
-- 📌 **Что нужно сделать:**
|
||||||
|
--
|
||||||
|
-- - Спроектируй таблицу, где каждая строка — один урок.
|
||||||
|
-- - Для каждого урока должны храниться:
|
||||||
|
-- - ID и название урока
|
||||||
|
-- - ID и название курса, к которому он относится
|
||||||
|
-- - Общее число просмотров
|
||||||
|
-- - Количество уникальных пользователей, посмотревших урок
|
||||||
|
-- - Дата первого и последнего просмотра
|
||||||
|
--
|
||||||
|
-- **Зачем это нужно:**
|
||||||
|
--
|
||||||
|
-- Эта витрина поможет выявлять наиболее популярные уроки и курсы, следить за актуальностью контента, понимать вовлечённость студентов по отдельным материалам.
|
||||||
|
SELECT l.lesson_id AS lesson_id,
|
||||||
|
l.title AS lesson_name,
|
||||||
|
c.course_id AS course_id,
|
||||||
|
c.title AS course_name,
|
||||||
|
countOrNull() AS total_view,
|
||||||
|
uniqOrNull(flv.user_id) AS unique_users,
|
||||||
|
min(flv.viewed_at) AS first_date,
|
||||||
|
max(flv.viewed_at) AS last_date
|
||||||
|
FROM pet_project.lessons l
|
||||||
|
LEFT JOIN pet_project.courses c ON c.course_id = l.course_id
|
||||||
|
LEFT JOIN pet_project.fact_lesson_views flv ON flv.lesson_id = l.lesson_id
|
||||||
|
GROUP BY l.lesson_id, l.title, c.course_id, c.title;
|
||||||
|
|
||||||
|
-- Создание мат view
|
||||||
|
CREATE MATERIALIZED VIEW pet_project.mv_lesson_popularity_summary
|
||||||
|
ENGINE = SummingMergeTree()
|
||||||
|
ORDER BY (lesson_id, course_id)
|
||||||
|
POPULATE
|
||||||
|
AS
|
||||||
|
SELECT l.lesson_id AS lesson_id,
|
||||||
|
any(l.title) AS lesson_name,
|
||||||
|
c.course_id AS course_id,
|
||||||
|
any(c.title) AS course_name,
|
||||||
|
count() AS total_views,
|
||||||
|
uniq(flv.user_id) AS unique_users,
|
||||||
|
min(flv.viewed_at) AS first_date,
|
||||||
|
max(flv.viewed_at) AS last_date
|
||||||
|
FROM pet_project.lessons l
|
||||||
|
LEFT JOIN pet_project.courses c ON c.course_id = l.course_id
|
||||||
|
LEFT JOIN pet_project.fact_lesson_views flv ON flv.lesson_id = l.lesson_id
|
||||||
|
GROUP BY l.lesson_id, c.course_id;
|
||||||
|
|
||||||
67
schema/tables.sql
Normal file
67
schema/tables.sql
Normal file
@@ -0,0 +1,67 @@
|
|||||||
|
-- create users table
|
||||||
|
CREATE TABLE pet_project.users
|
||||||
|
(
|
||||||
|
user_id UInt32,
|
||||||
|
name String,
|
||||||
|
age UInt16,
|
||||||
|
email String,
|
||||||
|
registration_date DateTime
|
||||||
|
)
|
||||||
|
ENGINE MergeTree()
|
||||||
|
ORDER BY (user_id);
|
||||||
|
|
||||||
|
-- create table course
|
||||||
|
DROP TABLE IF EXISTS pet_project.courses;
|
||||||
|
CREATE TABLE pet_project.courses
|
||||||
|
(
|
||||||
|
course_id UInt32,
|
||||||
|
title String,
|
||||||
|
category String,
|
||||||
|
created_at DateTime
|
||||||
|
)
|
||||||
|
ENGINE ReplacingMergeTree(created_at)
|
||||||
|
ORDER BY (course_id);
|
||||||
|
|
||||||
|
-- create table dim_lesson
|
||||||
|
DROP TABLE pet_project.lessons;
|
||||||
|
CREATE TABLE pet_project.lessons
|
||||||
|
(
|
||||||
|
lesson_id UInt32,
|
||||||
|
title String,
|
||||||
|
duration_min UInt16,
|
||||||
|
course_id UInt32
|
||||||
|
)
|
||||||
|
ENGINE MergeTree()
|
||||||
|
ORDER BY (lesson_id, course_id);
|
||||||
|
|
||||||
|
-- create table fact_lesson_views
|
||||||
|
DROP TABLE pet_project.fact_lesson_views;
|
||||||
|
CREATE TABLE pet_project.fact_lesson_views
|
||||||
|
(
|
||||||
|
id UInt32,
|
||||||
|
user_id UInt32,
|
||||||
|
lesson_id UInt32,
|
||||||
|
course_id UInt32,
|
||||||
|
viewed_at Datetime
|
||||||
|
)
|
||||||
|
ENGINE MergeTree()
|
||||||
|
PARTITION BY toYYYYMM(viewed_at)
|
||||||
|
ORDER BY (course_id, lesson_id, user_id);
|
||||||
|
ALTER TABLE pet_project.fact_lesson_views
|
||||||
|
ADD PROJECTION user_lookup (
|
||||||
|
SELECT * ORDER BY (user_id, lesson_id, course_id)
|
||||||
|
);
|
||||||
|
|
||||||
|
ALTER TABLE pet_project.fact_lesson_views
|
||||||
|
MATERIALIZE PROJECTION user_lookup;
|
||||||
|
|
||||||
|
-- create table enrollments
|
||||||
|
CREATE TABLE pet_project.enrollments
|
||||||
|
(
|
||||||
|
id UInt32,
|
||||||
|
user_id UInt32,
|
||||||
|
course_id UInt32,
|
||||||
|
enrolled_at DateTime
|
||||||
|
)
|
||||||
|
ENGINE MergeTree()
|
||||||
|
ORDER BY (user_id, course_id);
|
||||||
Reference in New Issue
Block a user