Разработка урока алгебры на тему Числовые характеристики выборки.

Автор публикации:

Дата публикации:

Краткое описание: ...


Урок в 7 классе.

Тема: Числовые характеристики выборки.

Цель урока:

  1. Познакомить учащихся с понятиями среднее значение, мода, медиана, размах.

  2. Вычисление средних по таблице частот.

  3. Объяснить учащимся необходимость изучения статистических характеристик.



Ход урока.

  1. Статистика знает всё”, – утверждали Ильф и Петров в своем знаменитом романе “Двенадцать стульев” и продолжали: “Известно, сколько какой пищи съедает в год средний гражданин республики… Известно, сколько в стране охотников, балерин, станков, велосипедов, памятников, маяков и швейных машинок… Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..”

Это ироническое описание дает довольно точное представление о статистике (от лат. status – состояние) – науке, изучающей, обрабатывающей и анализирующей количественные данные о самых разнообразных массовых явлениях в жизни. Экономическая статистика изучает изменение цен, спроса и предложения на товары, прогнозирует рост и падение производства и потребления. Медицинская статистика изучает эффективность различных лекарств и методов лечения, вероятность возникновения некоторого заболевания в зависимости от возраста, пола, наследственности, условий жизни, вредных привычек, прогнозирует распространение эпидемий. Демографическая статистика изучает рождаемость, численность населения, его состав (возрастной, национальный, профессиональный). А еще есть статистика финансовая, налоговая, биологическая, метеорологическая.

Мы с вами рассматриваем понятия и методы описательной статистики, которая занимается первичной обработкой статистической информации: представлением ее в виде удобно читаемых таблиц, изображением на диаграммах и вычислением наиболее показательных числовых характеристик.

По словам английского статистика Р. Фишера: “Статистика может быть охарактеризована как наука о сокращении и анализе материала, полученного в наблюдениях”.

Пример 1.Пусть ученик получил в течение года следующие отметки по алгебре: 5, 2, 4, 5, 5, 4, 4, 5, 5, 5. Какую четвертную отметку поставит ему учитель? Многих школьников волнует подобная проблема, и чаще всего ученики решают ее следующим естественным образом: складывают все отметки и делят сумму оценок на их количество. В нашем случае: [pic] Число 4,4, которое получается в результате, называется средним арифметическим. Поскольку такую оценку в журнал ставить не принято, учитель, скорее всего, округлит ее до 4.



Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. В статистике эту величину называют средним значением или выборочным средним.

В сельском хозяйстве на фермах, если все количество молока (в литрах) , полученное за сутки делят на количество коров , то узнают среднесуточный удой от одной коровы. Среднюю урожайность пшеницы с 1га находят так: весь полученный урожай пшеницы (в центнерах) делят на площадь полей, засеянных этой культурой (в га). Средняя выработка рабочего бригады за смену = ( работа всей бригады) : (количество рабочих)

Но иногда вычисление среднего арифметического не дает полезной информации. Например: Нецелесообразно использовать такие данные как: средняя температура больных в терапевтическом отделении, средний размер обуви, который носят учащиеся школы.

Пример 2.Если 1 человек получает зарплату 1 млн.рублей, а 99 других – 1000 рублей, то среднее по их зарплатам – примерно 11 000. Легко видеть, что 99% людей из данного расклада имеют зарплату в 11 раз меньше средней.



Среднее арифметическое, конечно, является важной характеристикой ряда чисел, в примере 1 — отметок за четверть, но иногда полезно рассматривать и другие средние. Например, претендуя на «5», ученик наверняка будет использовать такой аргумент: «Чаще всего в четверти я получал пятерки!». Статистик в этом случае сказал бы иначе: «Модой этого ряда является число 5».

Модой называют число ряда, которое встречается в этом ряду наиболее часто.

Можно сказать, что оно в этом ряду самое «модное».В отличие от среднего арифметического, которое можно вычислить для любого числового ряда, моды может вообще не быть. Например, пусть тот же ученик получил по русскому языку следующие отметки: 4, 2, 3, 5. Каждая отметка встречается в этом ряду только один раз, и среди них нет числа, встречающегося чаще других. Значит, у этого ряда нет моды. А вот среднее арифметическое, конечно, есть: (4 + 2 + 3 + 5) : 4 = 3,5.Такой показатель, как мода, можно использовать не только в числовых рядах. Вы уже знакомы с социологическими опросами. Если, например, опросить большую группу учеников, какой школьный предмет им нравится больше всего, то модой этого ряда ответов окажется тот предмет, который будут называть чаще остальных. Это одна из причин, по которой мода широко используется при изучении спроса. Например, при решении вопросов, в пачки какого веса фасовать масло, какие открывать авиарейсы и т.п., предварительно изучается спрос и выявляется мода — наиболее часто встречающийся заказ.



Еще одной важной статистической характеристикой ряда данных является его медиана. .

Пример 3. В конце года 11 учеников 8 класса сдавали норматив по бегу на 100 метров. Были зафиксированы следующие результаты:


Ученик

Результат (с)

Данила

15,3

Петя

16,9

Лена

21,8

Катя

18,4

Стас

16,1

Аня

25,1

Оля

19,9

Боря

15,5

Паша

14,7

Наташа

20,2

Миша

15,4



После того как все ребята пробежали дистанцию, к преподавателю подошел Петя и спросил, какой у него результат. «Самый средний результат: 16,9 секунды», — ответил учитель.«Почему? — удивился Петя. — Ведь среднее арифметическое всех результатов — примерно 18,3 секунды, а я пробежал на секунду с лишним лучше. И вообще, результат Кати (18,4) гораздо ближе к среднему, чем мой». «Твой результат средний, потому что пять человек пробежали лучше, чем ты, и пять — хуже. То есть ты как раз посередине», — сказал учитель. На языке статистики результат Пети называется медианой исходного ряда данных.

Для того чтобы найти медиану ряда чисел, нужно сначала их упорядочить — составить ранжированный ряд. В нашем примере он выглядит так:14,7; 15,3; 15,4; 15,5; 16,1; 16,9; 18,4; 19,9; 20,2; 21,8; 25,1. Средним (шестым по счету) числом является 16,9: пять чисел меньше него, пять чисел больше. Значит, 16,9 — медиана.

Медианой ряда, состоящего из нечетного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить. Медианой ряда, состоящего из четного количества чисел, называется среднее арифметическое двух стоящих посередине чисел этого ряда, если этот ряд упорядочить.

Достоинством медианы является ее большая по сравнению со средним арифметическим «устойчивость к ошибкам». Представим себе, что в наши наблюдения вкралась досадная оплошность: например, при записи одного из результатов соревнований мы пропустили десятичную запятую и вместо 20,2 написали 202. Тогда среднее арифметическое результатов возрастет с 18,1 секунды до 34,6 секунды, а медиана будет по-прежнему 16,9 секунды! В разных ситуациях имеет смысл использовать разные средние. Поясним это на примерах. Перед нами ранжированный ряд, представляющий данные о времени дорожно-транспортных происшествий на улицах Москвы в течение одних суток (в виде час:мин): 0:15, 0:55, 1:20, 3:20, 4:10, 6:10, 6:30, 7:15, 7:45, 8:40, 9:05, 9:20, 9:40, 10:15, 10:15, 11:30, 12:10, 12:15, 13:10, 13:50, 14:10, 14:20, 14:25, 15:20, 15:20, 15:45, 16:20, 16:25, 17:05, 17:30, 17:30, 17:45, 17:55, 18:05, 18:15, 18:45, 18:50, 19:45, 19:55, 20:30, 20:40, 21:30, 21:45, 22:10, 22:35. Как и для любого ряда, в данном случае мы можем найти среднее арифметическое — оно равно 13:33. Однако вряд ли имеет какой-то смысл утверждение типа «аварии на улицах Москвы происходят в среднем в 13 часов 33 минуты». В то же время, если сгруппировать данные этого ряда в интервалы, можно найти такой временной интервал, когда происходит наибольшее количество ДТП (такую характеристику называют интервальной модой). Получив такую характеристику, соответствующим службам имеет смысл серьезно проанализировать, почему именно в этот временной интервал происходит наибольшее количество происшествий, и попытаться устранить их причины.

  1. Рассмотрим теперь более трудный, но важный для практических целей вопрос. Мы знаем, что статистические данные могут быть представлены разными способами — например, может быть дана не сама выборка, а таблица частот. Как в этом случае найти среднее арифметическое, моду и медиану? Конечно, можно пойти по такому пути: восстановить по таблице саму выборку (точнее, ранжированный ряд) и «свести задачу к предыдущей». К счастью, в этом случае есть более рациональный способ вычислений.

Отметка

Абсолютная частота

Относительная частота

Накопленная частота

2

1

0,1

0,1

4

3

0,3

0,4

5

6

0,6

1

ИТОГО

10

1

 


Вернемся к примеру 1: ученик получил в течение четверти следующие отметки по алгебре: 5, 2, 4, 5, 5, 4, 4, 5, 5, 5.Представим эти данные в виде таблицы частот. Мы уже знаем, что для вычисления среднего арифметического надо сложить все числа ряда и поделить полученную сумму на их количество — получится 4,4. Но если мы знаем, сколько раз повторяется в выборке каждое значение (т.е. знаем его абсолютную частоту), вместо многократного сложения одного и того же числа можно умножить его на абсолютную частоту. Отсюда получается формула для вычисления среднего арифметического, использующая абсолютные частоты значений ряда: [pic]

Поделим теперь каждое слагаемое в этой формуле на знаменатель — получим формулу для среднего арифметического с помощью относительных частот:

2 ∙ 0,1 + 4 ∙ 0,3 + 5 ∙ 0,6 = 4,4.

Особенно ощутим выигрыш от использования приведенных формул, когда чисел в выборке много и они многократно повторяются. Что касается моды и медианы, то их вычисление по таблице частот происходит еще проще. Понятно, что для вычисления моды нужно найти максимальное значение в столбце абсолютных или относительных частот и выбрать соответствующее ему значение числового ряда. В нашем случае максимальная частота равна 6, значит, модой выборки будет 5. Если максимальных частот в таблице несколько, то выборка не имеет моды. Для вычисления медианы нужно найти первое значение накопленной частоты, превосходящее 0,5, и выбрать соответствующее ему значение числового ряда. В нашем случае накопленная частота впервые превосходит 0,5 только в последней строке таблицы, значит, медианой выборки будет 5. Вычисление числовых характеристик выборки по интервальной таблице частот нуждается в дополнительном комментарии. Ведь в такой таблице первый столбец занимают не числовые значения ряда, а целые интервалы. Каким образом умножать их на абсолютные или относительные частоты? В этом случае вместо интервалов используют их середины, т.е. полусуммы концов интервала.

Пример 4. Вычислим, сколько в среднем весит портфель первоклассника.


Вес портфеля (в кг)

Абсолютная частота

Относительная частота

от 1 до 2

6

0,3

от 2 до 3

10

0,5

от 3 до 4

3

0,15

от 4 до 5

1

0,05



С использованием абсолютных частот: [pic]

С использованием относительных частот: 1,5 · 0,3 + 2,5 · 0,5 + 3,5 · 0,15 + 4,5 · 0,05 = 2,45.

Конечно, при вычислении числовых характеристик выборки по интервальной таблице частот получаются только их приближенные значения, ведь мы заменяем целую группу чисел, попадающих в интервал, его серединой. Но с таким приближением вполне можно смириться: во-первых, величина интервалов небольшая; во-вторых, исходные значения выборки, как правило, лежат как слева, так и справа от середины; наконец, в-третьих, все статистические характеристики все равно носят изменчивый характер — в другой выборке они получатся иными. Так, в нашем примере с портфелями точное (до грамма) значение среднего арифметического будет 2,283 кг, в чем вы можете убедиться, если посчитаете его не по интервальной таблице частот, а по самой выборке, приведенной в примере 3. Но вряд ли такая точность имеет смысл в реальных статистических исследованиях.



Вопросы и задачи:

  1. Что такое среднее арифметическое, мода и медиана числового ряда?

  2. На стадионе «Локомотив» была зафиксирована следующая посещаемость первых четырех футбольных матчей: 24 000, 18 000, 22 000. Какова была средняя посещаемость этих матчей? Сколько зрителей должно посетить следующий матч, чтобы средняя посещаемость выросла?

  3. Найдите медиану следующих рядов данных: а) 8,4,9,5,2; б) [pic] , [pic] , [pic] .

  4. Президент компании получает зарплату 100 000 руб., четверо заместителей по 20 000 руб., а 20 служащих компании – по 10 000 руб. Найдитте все средние характеристики зарплат в компании. Какую характеристику выгоднее использовать президенту в рекламных целях?

  5. Каждое число исходного ряда увеличили на 10. Что произойдет с его средним арифметическим? модой? медианой?

  6. Все числа исходного ряда увеличили в 2 раза. Что произойдет с его средним арифметическим? модой? медианой?

  7. Найдите для числового ряда 1, 2, 3, 4, х все возможные значения х, при которых:

а) среднее арифметическое ряда равно 3;

б) мода равна 3;

в) медиана равна 3.

8. В таблице приведены данные о возрастном составе участников школьного хора:

Найдите среднее арифметическое, моду, медиану возрастов участников хора.

возраст

7

8

9

10

11

12

13

14

15

Число участников

3

6

5

1

2

3

2

2

1



  1. В таблице приведены данные о росте участников легкоатлетических соревнований:



Рост (см)

160-165

165-170

170-175

175-180

180-185

185-190

190-…

Число участников

5

12

19

25

10

7

2



Найдите среднее арифметическое, интервальную моду, медиану ростов участников соревнований.