Mean = Σ(f × x) / Σf
На экзамене часто дают таблицу с частотами и просят найти среднее. Формула простая: умножаешь каждое значение на его частоту, складываешь всё, делишь на общее число данных. Калькулятор посчитает арифметику, но ты должна правильно составить выражение Σ(f × x) / Σf.
Use the midpoint of each class interval.
Estimated mean = Σ(f × midpoint) / Σf
Когда данные сгруппированы в интервалы (например, 10–20, 20–30), точные значения неизвестны — поэтому берём середину каждого интервала. Это даёт приблизительное среднее. Главная ловушка — использовать границы интервала вместо середины (см. Trap 1 ниже).
Running total of frequencies.
Example (ISMA Prep Q12):
| Time (t min) | Frequency | Cumulative Frequency |
|---|---|---|
| $0 < t \leq 10$ | 7 | 7 |
| $10 < t \leq 20$ | 26 | 33 |
| $20 < t \leq 30$ | 24 | 57 |
| $30 < t \leq 40$ | 14 | 71 |
| $40 < t \leq 50$ | 7 | 78 |
| $50 < t \leq 60$ | 2 | 80 |
Кумулятивная (накопительная) частота — это нарастающий итог. Каждая следующая строка включает все предыдущие. Эта таблица нужна, чтобы построить кумулятивный график, по которому потом находят медиану и квартили. На экзамене ISMA это было в Q12 — очень типичное задание.
Это ключевой навык: по графику находишь медиану (проводишь горизонтальную линию от n/2), Q1 (от n/4) и Q3 (от 3n/4). Экзамен часто просит найти все три значения и IQR. Запомни: читаешь по оси Y → находишь точку на кривой → опускаешь на ось X.
P(t > 42): Using interpolation in the 40 < t ≤ 50 class:
$\displaystyle CF at t = 42: 71 + \frac{42-40}{10} \times 7 = 72.4$
$\displaystyle P(t > 42) = \frac{80 - 72.4}{80} = \frac{7.6}{80} \approx 0.095$
Это продвинутый вопрос: тебя просят найти вероятность P(t > x), используя кумулятивный график или интерполяцию внутри интервала. Формула: P(t > x) = (n − CF(x)) / n. Такие задания дают дополнительные баллы на экзамене и связывают статистику с темой вероятности (Chapter 6).
A box-and-whisker plot (box plot) displays five key values from a data set:
| Value | Meaning |
|---|---|
| Minimum | The smallest value |
| Q1 (lower quartile) | 25% of data is below this value |
| Median (Q2) | The middle value — 50% above, 50% below |
| Q3 (upper quartile) | 75% of data is below this value |
| Maximum | The largest value |
How to find the five-number summary:
Example 1: Find the five-number summary of: 4, 7, 8, 12, 15, 18, 20, 22, 25
Ordered (already sorted), $n = 9.$
Median = 5th value = 15
Lower half: $\displaystyle 4, 7, 8, 12 \rightarrow Q1 = \frac{7 + 8}{2} = 7.5$
Upper half: $\displaystyle 18, 20, 22, 25 \rightarrow Q3 = \frac{20 + 22}{2} = 21$
Five-number summary: $min = 4, Q1 = 7.5, median = 15, Q3 = 21, max = 25$
$IQR = Q3 - Q1 = 21 - 7.5 = 13.5$
Пять чисел (min, Q1, медиана, Q3, max) — основа для box plot. На экзамене могут дать данные и попросить найти все пять значений. Главное: сначала упорядочи данные, потом раздели на нижнюю и верхнюю половины для нахождения Q1 и Q3. IQR = Q3 − Q1 показывает разброс центральных 50% данных.
Steps:
На экзамене могут попросить построить box plot по данным. Алгоритм: найди 5 чисел (раздел 3.1) → нарисуй числовую ось → отметь точки → начерти коробку от Q1 до Q3 → линия медианы внутри → усы до min и max. Это чисто механическая процедура — если знаешь 5 чисел, построение простое.
Each part of a box plot tells you something about the data:
Экзамен часто даёт готовый box plot и просит его интерпретировать. Нужно уметь определить: где центр данных (медиана), насколько данные разбросаны (IQR и range), и в какую сторону скошены (skew). Если медиана ближе к Q1 — правый скос (positively skewed), ближе к Q3 — левый (negatively skewed).
When comparing two or more data sets, draw box plots on the same number line scale. This allows direct comparison of:
Example 2: Ashley travels to school either by car or by bus. She recorded travel times (in minutes) over 15 days for each mode:
Car: 17, 12, 14, 5, 9, 28, 15, 14, 10, 16, 15, 14, 5, 11, 15
Bus: 19, 13, 12, 15, 30, 16, 17, 11, 14, 13, 15, 15, 12, 15, 12
Step 1 — Order each dataset:
Car (ordered): 5, 5, 9, 10, 11, 12, 14, 14, 14, 15, 15, 15, 16, 17, 28
Bus (ordered): 11, 12, 12, 12, 13, 13, 14, 15, 15, 15, 15, 16, 17, 19, 30
Step 2 — Five-number summaries (n = 15, so median is the 8th value; Q1 is median of values 1–7; Q3 is median of values 9–15):
| Min | Q1 | Median | Q3 | Max | |
|---|---|---|---|---|---|
| Car | 5 | 10 | 14 | 15.5 | 28 |
| Bus | 11 | 12 | 15 | 16 | 30 |
Step 3 — Draw parallel box plots:
Step 4 — Compare:
Это один из самых частых вопросов на экзамене: дают два box plot на одной шкале и просят сравнить. Всегда сравнивай по четырём пунктам: медиана (кто выше?), IQR (у кого больше разброс?), range (у кого шире?), skewness (симметричность). Используй слова «more consistent» и «more variable» — экзаменаторы это любят.
Обозначения множеств — это «язык», который нужно знать наизусть. На экзамене часто дают вопросы True/False на понимание разницы между ∈ (элемент множества) и ⊂ (подмножество). Ключевое: a ∈ {a,b,c} — верно, но {a} ∈ {a,b,c} — неверно (это множество, а не элемент).
A Venn diagram shows sets as overlapping circles inside a rectangle (the universal set U). Every element belongs to exactly one region.
| Region | Set notation | Description |
|---|---|---|
| Intersection | A ∩ B | Elements in BOTH A and B |
| Union | A ∪ B | Elements in A OR B (or both) |
| A only | A ∩ B' | Elements in A but NOT in B |
| B only | A' ∩ B | Elements in B but NOT in A |
| Complement of A | A' | Everything NOT in A (includes B only + outside) |
| Neither | $(A ∪ B)' = A' ∩ B'$ | Elements in NEITHER A nor B |
| Symmetric difference | A △ B | Elements in A or B but NOT both (both crescents) |
| Complement of intersection | (A ∩ B)' | Everything EXCEPT the overlap |
Диаграмма Венна — визуальный инструмент для задач на множества. На экзамене могут попросить заштриховать область (например, A ∩ B' — «только A»), или определить, какая область соответствует выражению. Знай все 8 стандартных областей из таблицы выше — это покрывает любой экзаменационный вопрос.
Addition rule (inclusion-exclusion):
$n(A ∪ B) = n(A) + n(B) - n(A ∩ B)$
For the universal set:
n(U) = n(A only) + n(B only) + n(A ∩ B) + n(neither)
De Morgan's Laws:
Example: $U = {1,2,...,20}, A = {multiples of 3} = {3,6,9,12,15,18}, B = {multiples of 4} = {4,8,12,16,20}$
Формула включения-исключения n(A ∪ B) = n(A) + n(B) − n(A ∩ B) — самая важная. Она нужна почти в каждой задаче на множества. Законы Де Моргана помогают с дополнениями: (A ∪ B)' = A' ∩ B'. На экзамене обычно дают числа для двух из трёх величин и просят найти третью.
(a) 4 ∈ {even integers} → True
(b) {a} ∈ {a, b, c} → False ({a} is a set, not an element; but {a} ⊂ {a,b,c} is True)
(c) { } ⊂ {3,4,5,6} → True (empty set is subset of every set)
(d) 0 ⊂ {0,1,2} → False (0 is an element, not a set; 0 ∈ {0,1,2} is True)
(e) 51 ∉ {prime numbers} → True (51 = 3 × 17)
(f) {n: n divisible by 2, 3, and 4} = {k: k is multiple of 24} → False
LHS = multiples of LCM(2,3,4) = multiples of 12, not 24.
Такие вопросы были на IB 2013 (Q8) — дают утверждения и спрашивают, верны они или нет. Это проверка понимания обозначений: разница между ∈ и ⊂, свойства пустого множества, и внимательность к деталям (например, ∅ ⊂ A всегда верно, а 0 ⊂ A — бессмыслица, потому что 0 не множество).
General term: uₙ = a + (n−1)d where a = first term, d = common difference.
Sum of n terms: Sₙ = (n/2)(2a + (n−1)d) or Sₙ = (n/2)(first + last)
Example (ISMA Prep Q23): First term = 1, d = 4. Find sum from 41st to 100th term.
$u_{41} = 1 + 40(4) = 161$
$u_{100} = 1 + 99(4) = 397$
Number of terms = 60
$\displaystyle S = \frac{60}{2}(161 + 397) = 30 \times 558 = 16740$
Арифметическая последовательность — когда каждый следующий член отличается на одно и то же число d. Две формулы: uₙ = a + (n−1)d для n-го члена и Sₙ = (n/2)(first + last) для суммы. На экзамене ISMA (Q23) была именно такая задача. Главная ловушка — ошибка на единицу: u₁₀₀ = a + 99d, а не a + 100d.
Example: Milestones problem. 742 gaps. Posters alternate 3, 4, 3, 4, ...
Odd-numbered gaps: 3 posters. Even-numbered: 4 posters.
$371 \text{of each }. Total = 371(3) + 371(4) = 1113 + 1484 = 2597$
Не все задачи на последовательности используют стандартные формулы. Иногда нужно увидеть паттерн (чередование, группировка) и разбить задачу на части. Такие задачи проверяют логическое мышление — калькулятор тут не поможет, нужно правильно составить план решения.
❌ Trap 1: Grouped data — using class boundaries instead of midpoints
Class 10–20, frequency 5. Using 10 × 5 or 20 × 5 for the mean — WRONG!
✅ Use the MIDPOINT: (10+20)/2 = 15. Contribution = 15 × 5 = 75.
Ловушка: для сгруппированных данных используй СЕРЕДИНУ интервала, не границы. Средняя = Σ(f × середина) / Σf.
❌ Trap 2: Median without sorting
Data: 5, 2, 8, 1, 9. Median = 8 (middle in the list) — WRONG!
✅ Sort first: 1, 2, 5, 8, 9. Median = 5 (middle of sorted list).
Ловушка: для медианы данные ОБЯЗАТЕЛЬНО упорядочь по возрастанию. Потом бери средний элемент.
❌ Trap 3: Cumulative frequency plotted at midpoint
Plotting CF at the midpoint of each class interval — WRONG!
✅ CF is always plotted at the UPPER BOUNDARY of each class.
Ловушка: кумулятивную частоту отмечай на ВЕРХНЕЙ границе интервала, не в середине.
❌ Trap 4: IQR confused with range
IQR = max − min — WRONG! That's the range.
✅ IQR = Q3 − Q1. Range = max − min. They are different measures of spread.
Ловушка: IQR (межквартильный размах) = Q3 − Q1. Range (размах) = max − min. Не путай!
❌ Trap 5: Set notation — ∈ vs ⊂
{a} ∈ {a, b, c} — WRONG! {a} is a set, not an element.
✅ a ∈ {a, b, c} (element of). {a} ⊂ {a, b, c} (subset of). Curly braces = set.
Ловушка: ∈ для элементов: a ∈ A. ⊂ для множеств: {a} ⊂ A. Фигурные скобки делают элемент множеством!
❌ Trap 6: Arithmetic sequence — off-by-one error
$100th term: u_{100} = a + 100d — WRONG!$
✅ u₁₀₀ = a + 99d. Formula: uₙ = a + (n−1)d. The 1st term adds 0 times d.
Ловушка: u₁₀₀ = a + 99d, НЕ a + 100d. Первый член — n = 1, добавляем (1−1) = 0 раз d.
❌ Trap 7: Counting terms in a range
Terms from 41st to 100th: that's 100 terms — WRONG!
✅ Number of terms from k to n = n − k + 1 = 100 − 41 + 1 = 60.
Ловушка: количество членов от k-го до n-го = n − k + 1. От 41-го до 100-го = 60, не 100 и не 59.
❌ Trap 8: Empty set is a subset of every set
∅ ⊂ {1, 2, 3} → False? — WRONG!
✅ TRUE. The empty set is a subset of every set. This is a classic exam trick.
Ловушка: пустое множество ∅ является подмножеством ЛЮБОГО множества. Это часто проверяют на экзамене.
A1. Jenny's 6 cards in order: 5, ?, ?, ?, ?, 24. Median = 14, mode = 8. Find possible values.
A2. Basketball: 5 games, mean = 21 pts. After 6 games, mean = 23. Points in game 6?
A3. Data: 3, 5, 7, 7, 8, 10, 12, 15, 20. Find mean, median, mode.
A4. 10 students' marks: 45, 52, 55, 60, 62, 65, 70, 75, 80, 86. Find Q1, Q2, Q3, IQR.
A5. A set of 5 numbers has mean = 8, median = 7, mode = 5. The largest number is 15. Find all five numbers.
B1. (ISMA Prep Q12)
| Time (t min) | Freq |
|---|---|
| $0 < t \leq 10$ | 7 |
| $10 < t \leq 20$ | 26 |
| $20 < t \leq 30$ | 24 |
| $30 < t \leq 40$ | 14 |
| $40 < t \leq 50$ | 7 |
| $50 < t \leq 60$ | 2 |
(a) Complete the cumulative frequency table.
(b) Estimate the median time.
(c) Estimate P(time > 42 minutes).
B2. 50 students' heights:
| Height (cm) | Freq |
|---|---|
| 140-150 | 4 |
| 150-160 | 12 |
| 160-170 | 20 |
| 170-180 | 10 |
| 180-190 | 4 |
Find the estimated mean height.
C1. State True or False:
(a) 4 ∈ {even integers}
(b) {a} ∈ {a, b, c}
(c) { } ⊂ {3, 4, 5, 6}
(d) 0 ⊂ {0, 1, 2}
(e) 51 ∉ {prime numbers}
(f) {n: n divisible by 2, 3, and 4} = {k: k is multiple of 24}
C2. A = {1,2,3,4,5}, B = {3,4,5,6,7}. Find: $A∪B, A∩B, A', if \varepsilon = {1..10}.$
C3. $n(\varepsilon ) = 40, n(A) = 22, n(B) = 18, n(A∩B) = 8. Find n(A∪B), n(A'∩B').$
C4. How many numbers smaller than 20000, divisible by 5, can be formed using digits 0,1,3,5,7,9?
D1. First term 1, common difference 4. Find sum from 41st to 100th term inclusive.
D2. Arithmetic sequence: u₅ = 17, u₁₂ = 38. Find a and d. Find u₂₀.
D3. Sum of first 20 terms of an AP is 650 and first term is 4. Find common difference and u₂₀.
D4. 743 milestones. Between 1st-2nd: 3 posters, 2nd-3rd: 4, then alternating 3,4,3,4... Total posters?
E1. Given the dataset: 3, 7, 8, 10, 12, 14, 15, 18, 21, 25
(a) Find the five-number summary.
(b) Calculate the IQR.
(c) Draw a box-and-whisker plot.
E2. Two classes took the same test. Their results are summarised:
| Min | Q1 | Median | Q3 | Max | |
|---|---|---|---|---|---|
| Class A | 35 | 52 | 65 | 78 | 95 |
| Class B | 40 | 58 | 62 | 74 | 88 |
(a) Which class had the higher median score?
(b) Which class had the larger IQR?
(c) Which class had the more consistent results? Explain your reasoning.
E3. From a box plot, the box extends from 20 to 45, the median line is at 30, the whiskers reach 5 and 60.
(a) State the five-number summary.
(b) Find the IQR and range.
(c) Is the data skewed? Explain which direction.
A1. Шесть карт Дженни в порядке возрастания: 5, ?, ?, ?, ?, 24. Медиана = 14, мода = 8.
A2. Баскетбол: 5 игр, среднее = 21 очко. После 6 игр, среднее = 23.
Сумма за 5 игр: 5 × 21 = 105. Сумма за 6 игр: 6 × 23 = 138.
Очки в 6-й игре: 138 − 105 = 33
A3. Данные: 3, 5, 7, 7, 8, 10, 12, 15, 20. Всего 9 значений.
A4. 10 оценок в порядке: 45, 52, 55, 60, 62, 65, 70, 75, 80, 86.
A5. 5 чисел: среднее = 8, медиана = 7, мода = 5. Наибольшее = 15.
Сумма = 5 × 8 = 40. Медиана (3-е число) = 7. Мода = 5 → минимум два числа = 5.
Расстановка: 5, 5, 7, ?, 15. Сумма: 5 + 5 + 7 + ? + 15 = 40 → ? = 8.
Проверка: 5, 5, 7, 8, 15. Среднее = 40/5 = 8 ✓. Медиана = 7 ✓. Мода = 5 ✓.
Ответ: 5, 5, 7, 8, 15
B1. Кумулятивная (накопленная) частота для времени ожидания.
(a) Последовательно складываем: 7, 7+26=33, 33+24=57, 57+14=71, 71+7=78, 78+2=80
Кумулятивные частоты: 7, 33, 57, 71, 78, 80
(b) Медиана: 80/2 = 40-й человек. По таблице: 40 попадает в интервал 20–30 (CF от 33 до 57).
Медиана ≈ 20 + (40 − 33)/(57 − 33) × 10 = 20 + 7/24 × 10 ≈ 20 + 2.9 ≈ 23 мин
Формула интерполяции: нижняя граница + (нужная позиция − CF до) / частота × ширина интервала.
(c) P(время > 42 мин). В интервале 40–50: 7 человек. Из них > 42: примерно 7 × (50−42)/(50−40) = 5.6. Плюс в 50–60: 2. Всего ≈ 7.6 из 80.
P ≈ 7.6/80 ≈ 0.095
B2. Оценка среднего из сгруппированных данных. Используем середины интервалов:
145×4 + 155×12 + 165×20 + 175×10 + 185×4 = 580 + 1860 + 3300 + 1750 + 740 = 8230
Среднее = 8230 / 50 = 164.6 см
Важно: для сгруппированных данных среднее — оценка, потому что мы не знаем точные значения внутри интервалов.
C1. Верно или нет?
(a) 4 ∈ {чётные числа} — Верно. 4 — чётное число, оно принадлежит множеству.
(b) {a} ∈ {a, b, c} — Неверно. {a} — это множество, а элементами {a, b, c} являются буквы a, b, c (не множества). Верно: a ∈ {a, b, c} или {a} ⊂ {a, b, c}.
(c) { } ⊂ {3, 4, 5, 6} — Верно. Пустое множество является подмножеством любого множества.
(d) 0 ⊂ {0, 1, 2} — Неверно. 0 — это элемент, не множество. Верно: 0 ∈ {0, 1, 2}.
(e) 51 ∉ {простые числа} — Верно. 51 = 3 × 17, значит 51 составное.
(f) {n: n делится на 2, 3 и 4} = {k: k кратно 24} — Неверно. НОК(2, 3, 4) = 12, не 24. Правильно: {кратные 12}.
C2. A = {1,2,3,4,5}, B = {3,4,5,6,7}, ε = {1..10}.
C3. n(ε) = 40, n(A) = 22, n(B) = 18, n(A∩B) = 8.
n(A ∪ B) = n(A) + n(B) − n(A∩B) = 22 + 18 − 8 = 32
n(A' ∩ B') = n(ε) − n(A ∪ B) = 40 − 32 = 8 (вне обоих множеств)
Формула включения-исключения — одна из ключевых на экзамене!
C4. Сколько чисел меньше 20000, делящихся на 5, можно составить из цифр 0, 1, 3, 5, 7, 9?
Число делится на 5 → последняя цифра 0 или 5. Число < 20000 → до 5 цифр. Цифры можно повторять.
Это задача на перебор с ограничениями. Считаем по количеству цифр:
Итого: 1 + 10 + 60 + 360 + 432 = 863
D1. AP: a = 1, d = 4. Найти сумму с 41-го по 100-й член.
u₄₁ = 1 + 40 × 4 = 161. u₁₀₀ = 1 + 99 × 4 = 397.
Количество членов: 100 − 41 + 1 = 60.
S = (60/2)(161 + 397) = 30 × 558 = 16740
D2. AP: u₅ = 17, u₁₂ = 38.
u₅ = a + 4d = 17, u₁₂ = a + 11d = 38. Вычитаем: 7d = 21 → d = 3, a = 17 − 12 = 5.
u₂₀ = 5 + 19 × 3 = 62
D3. S₂₀ = 650, a = 4. S₂₀ = (20/2)(2a + 19d) = 10(8 + 19d) = 650.
8 + 19d = 65 → 19d = 57 → d = 3.
u₂₀ = 4 + 19 × 3 = 61
D4. 743 столба → 742 промежутка. Чередуются: 3 плаката, 4 плаката, 3, 4...
742 промежутка: 371 нечётных (по 3) + 371 чётных (по 4).
Всего: 371 × 3 + 371 × 4 = 1113 + 1484 = 2597
E1. Данные: 3, 7, 8, 10, 12, 14, 15, 18, 21, 25 (10 значений).
(a) Min = 3, Max = 25. Q2 = (12 + 14)/2 = 13. Q1 = 8 (медиана нижних 5). Q3 = 18 (медиана верхних 5).
Пятиточечная сводка: Min = 3, Q1 = 8, Med = 13, Q3 = 18, Max = 25
(b) IQR = 18 − 8 = 10
(c) Ящик от 8 до 18, линия медианы на 13, усы до 3 и 25.
E2. Два класса.
(a) Класс A: медиана 65. Класс B: медиана 62. Выше у класса A.
(b) IQR A = 78 − 52 = 26. IQR B = 74 − 58 = 16. Больше у класса A (IQR = 26).
(c) Класс B более стабилен, потому что IQR меньше (16 vs 26) — средние 50% результатов более плотно сгруппированы.
E3. Из диаграммы: ящик от 20 до 45, медиана 30, усы до 5 и 60.
(a) Min = 5, Q1 = 20, Med = 30, Q3 = 45, Max = 60
(b) IQR = 45 − 20 = 25. Размах = 60 − 5 = 55.
(c) Данные скошены вправо (положительная асимметрия): медиана (30) ближе к Q1 (20), чем к Q3 (45). Верхняя половина ящика шире нижней.
A1. e.g. 5, 8, 8, 20, 23, 24 (other valid sets possible)
A2. 33 points
A3. Mean = 9.67, Median = 8, Mode = 7
A4. $Q1 = 55, Q2 = 63.5, Q3 = 75, IQR = 20$
A5. 5, 5, 7, 8, 15
B1.
(a) 7, 33, 57, 71, 78, 80
(b) 23 min
(c) 0.095
B2. 164.6 cm
C1.
(a) True
(b) False
(c) True
(d) False
(e) True
(f) False
C2. $A∪B = {1,2,3,4,5,6,7}, A∩B = {3,4,5}, A' = {6,7,8,9,10}$
C3. $n(A∪B) = 32, n(A'∩B') = 8$
C4. 863
D1. 16740
D2. $a = 5, d = 3, u_{20} = 62$
D3. $d = 3, u_{20} = 61$
D4. 2597
E1.
(a) $Min = 3, Q1 = 8, Median = 13, Q3 = 18, Max = 25$
(b) $IQR = 18 - 8 = 10$
(c) Box plot drawn with box from 8 to 18, median at 13, whiskers to 3 and 25
E2.
(a) Class A (median 65 vs 62)
(b) Class A (IQR = 26 vs 16)
(c) Class B is more consistent because it has a smaller IQR (16 vs 26), meaning the middle 50% of scores are more tightly clustered.
E3.
(a) $Min = 5, Q1 = 20, Median = 30, Q3 = 45, Max = 60$
(b) $IQR = 45 - 20 = 25, Range = 60 - 5 = 55$
(c) Positively skewed (right-skewed) — the median (30) is closer to Q1 (20) than to Q3 (45), meaning the upper half of the box is wider than the lower half.