Тест возникновение. Возникновение тестирования. Возникновение и развитие метода тестирования

История развития системы тестирования в России и за рубежом

План

Возникновение тестирования.

Первые педагогические тесты.

Развитие тестирования в России.

Современная теория тестов (IRT).

Возникновение тестирования

Всякая попытка определить точное время возникновения тестов напоминает стремление географов найти точное начало большой реки, вытекающей множеством ручейков из обширного болота. Примерно так же обстоит дело и с тестами. Для изучения истории тестов вначале потребовалось изучить предысторию – то самое болото, из которого и вытекает их подлинная история.

В Древнем Египте искусству жрецов обучали только тех, кто выдерживал систему определенных испытаний. Вначале кандидат проходил процедуру, которую можно было бы сейчас назвать собеседованием. При этом выясняли биографические данные, уровень образованности, оценивали внешность, умение вести беседу. Затем проверяли умения – трудиться, слушать, молчать. Проводили испытания огнем, водой и угрозой смерти. Тем, кто не уверен, что выдержит все тяготы длительного образования, предлагалось подумать – с какой стороны окончательно закрыть за собой дверь в храм – с внутренней или внешней?

Сообщается (там же), что эту суровую систему испытаний и отбора успешно преодолел в молодые годы Пифагор. Вернувшись после учебы в Грецию, он основал свою школу, допуск в которую открывал только после серии различных испытаний, похожих на те, которые выдержал он сам.

Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что "не из каждого дерева можно выточить Меркурия". И потому придавал значение диагностике, в первую очередь, именно этих способностей, что делалось с помощью трудных математических задач.

Как считают, Пифагор обращал также внимание на походку и на смех молодых людей, утверждая, что манера смеяться служит самым хорошим показателем характера человека. Он внимательно относился к рекомендациям родителей и учителей, тщательно вел наблюдение за каждым новичком, особенно после того, как последнего приглашали свободно высказываться и, не стесняясь, смелее оспаривать мнение собеседников (там же).

В III тысячелетии до н.э. в Китае существовала должность правительственного чиновника. Соответственно, появились и первые элементы профотбора на эту должность. Отбору способствовала атмосфера торжественности и внимания к молодым людям, осмелившимся держать государственные экзамены на занятие по этой должности. В китайском обществе эти экзамены воспринимались почти как празднество. Тему экзамена нередко давал сам император, и он же проводил проверку знаний претендентов и на заключительном этапе конкурса.

Одной из самых распространенных форм диагностики способностей человека в те времена была физиогномика – искусство распознавания характера и способностей человека по его внешнему виду. Гиппократ, впервые употребивший это название, считал физиогномику наукой. Тогда же появились первые учебники и практические руководства по физиогномике, а также и первые специалисты.

Имеется немало свидетельств применения различных испытаний в Древнем Риме и Спарте. В Спарте была создана и успешно осуществлялась система воспитания воинов, в Риме – система обучения гладиаторов. "Люди– писал Платон, – рождаются не слишком похожими друг на друга, их природа различна, да и способности к тому или иному делу также... Поэтому можно сделать все в большем количестве, лучше и легче, если выполнять одну какую-нибудь работу соответственно своим природным задаткам".

В Афинах обсуждался вопрос о зависимости могущества государства от способностей лиц, им управляющих. В работе Платона "Государство" на вопрос о том, каких правителей нужно выбирать, Сократ отвечает: "Надо отдавать предпочтение самым надежным, мужественным, и по возможности, самым благообразным; кроме того, надо отыскивать людей не только благородных и строгого нрава, но и обладающих также свойствами, подходящими для такого воспитания. У них... должна быть острая восприимчивость к наукам и быстрая сообразительность. Надо искать человека с хорошей памятью, несокрушимо твердого и во всех отношениях трудолюбивого" (там же).

Нередко результаты испытания интеллектуальных способностей становились предметом гордости. Сообщается, например, что индийский царь Девсарам, желая испытать мудрость иранцев, прислал им шахматы. Предполагалось, что иранцы вряд ли сумеют разгадать суть этой игры, и потому они должны были, по условию, отослать в Индию подать. Однако визирь Важургмихр понял правила игры и, в свою очередь, изобрел игру, называемую сейчас нарды. Эту игру он послал в Индию, и там выяснилось, что разгадать правила этой игры индийцы не смогли.

Различные конкурсы и экзамены устраивались и в средневековом Вьетнаме. Всего за два года, в период с 1370 по 1372 г. удалось провести переаттестацию всех гражданских чиновников и военнослужащих, что позволило улучшить работу государственного аппарата. В результате этого Вьетнам стал сильным и жизнеспособным государством. Особое внимание было уделено созданию боеспособного офицерского корпуса. В ХV в. экзамены были там упорядочены. Они проводились по этапам и турам. Лауреаты получали подарки от короля, их имена вносились в "золотой список", который вывешивался у Восточных ворот столицы, об их победах на конкурсе сообщалось в родную общину. Имена наиболее отличившихся участников высекались на специальных каменных стелах, установленных в Храме Литературы (там же).

Если использование письменных контрольных работ и экзаменов в странах Востока уже в те годы считалось вполне нормальным и естественным делом, то этого нельзя сказать о странах Запада. Там возникали трудности психологического характера, вызванные попытками замены привычных устных форм контроля письменными. Например, в Англии сто лет ушло на слом консервативных традиций, препятствовавших применению письменных контрольных работ в учебном процессе, и еще сто лет на то, чтобы последние начали использоваться на приемных и выпускных экзаменах.

Впрочем, были исключения. В той же Англии ценность письменных работ быстрее других оценил Орден Иезуитов, увидевший в них средство повышения мотивации учебной работы. Используя свое влияние, Орден распространил практику применения письменных работ во многих других странах. Ответная реакция на это в первую очередь проявилась в Америке. Сообщается, что там, в 1762 г., состоялось открытое выступление студентов Йельского университета против использования письменной формы экзаменов, из-за которых им приходится много зубрить.

В 1884г. в США вышла первая книга с тестовыми материалами, содержавшая задания и ответы к ним с оценкой по пятибалльной шкале. В этой книге содержались задания по математике, истории, грамматике, навигации, давались примерные тексты сочинений вместе с методом количественной оценки сочинений. Это был первый в истории случай использования простейших статистических расчетов в педагогической работе.

Быстро распространявшись в США, такая форма контроля знаний имела не только много сторонников, но и противников. Сообщается, например, о школьном инспекторе из Чикаго, запретившем в 1881г. проводить письменный контроль и обязавшем осуществлять перевод учащихся в очередной класс не на основе проверок, а опираясь исключительно на мнения учителей и директоров школ. Распространилось мнение, что никто лучше учителя не сможет оценить способности ученика, и потому экзамены и всякие другие формы контроля являются издевательством над здравым смыслом. Этим было положено начало общественному движению против какого-либо контроля в школе. Пик такого движения в США пришелся на конец XIX века (1880-е годы), после чего вновь стали появляться предпосылки для формирования благожелательного отношения к контролю знаний.

Потребность в создании общественно-государственной системы контроля знаний была осознана в США в 1885 году. В Нью-Йорке начал действовать экзаменационный совет – один из немногих советов, которые смогли разработать методы объективного контроля знаний. Начало общегосударственной системы оценки знаний положило создание там в 1900 году комитета по проверке знаний абитуриентов колледжей в США.

В России конца XIX – начала XX века вопрос разработки тестов и их применения не ставился и не обсуждался. “Проверка знаний, – писал один из авторов, – представляется мне по опыту самым скучным, бесполезным и даже вредным занятием. Она терпима, как необходимое зло, только там, где от учителя требуют ежемесячных отметок как средства контроля не только над учениками, но и над учителем”. Однако с той поры в российской педагогике стихийно сформировались две противоречащие тенденции: одна за контроль знаний учащихся, другая – против.

Приведенный здесь краткий исторический экскурс позволяет сделать вывод о необходимости рассматривать испытания как важную часть жизни многих – если не всех – народов мира, со времен древнейших цивилизаций и до наших дней. Однако можно ли на основании приведенных данных говорить о раннем историческом периоде возникновения тестов? Если согласиться с наиболее распространёнными сейчас определениями теста, даваемыми как перевод с английского слова "test" (испытание, проверка, проба), то на поставленный вопрос надо будет ответить утвердительно. А если не согласиться? Тогда надо допустить, что настоящие тесты появились позже, в конце XIX-начале XX века.

1.1. Зарождение тестологии.

1.2. Тесты Дж. Кеттелла, А. Бине, Т. Симона и др.

1.1. Время зарождения тестологии относят ко второй половине XIX века, когда психологи стали исследовать индивидуальные различия физических, физиологических и психических особенностей человека.

В середине ХIХ века особое внимание исследователей уделялось изучению умственной отсталости, которую в этот период впервые стали рассматривать как болезнь. Французский врач Э. Сеген разработал собственную методику и основал первую школу для обучения умственно отсталых. Впоследствии многие из разработанных им приемов вошли в тесты на выявление уровня интеллекта.

Одним из первых, кто начал использовать тестовые технологии для измерения индивидуальных особенностей, стал английский биолог Френсис Гальтон. Он занимался вопросом наследственности, при этом разработал ряд методик для определения зрительной, слуховой и тактильной чувствительности, а также для определения мускульной силы, скорости реакции и др. В ходе сбора эмпирических данных Гальтон обследовал множество учреждений в системе образования с целью получить систематические измерения антропометрических характеристик учащихся. В 1884 году он организовал антропометрическую лабораторию на Всемирной выставке в Лондоне, где каждый желающий за небольшую плату мог измерить свои физические возможности по 17 показателям: рост, вес, сила кисти, сила удара, различения цвета, острота зрения и др. Таким образом, накапливались первые систематические данные по индивидуальным особенностям простых психофизических функций. По мнению Ф.Гальтона, тесты сенсорного различения можно использовать как средство оценки интеллекта человека.

Ф. Гальтон был первым, кто применил оценочные шкалы, анкетирование и технику свободных ассоциаций.

Он сформулировал три принципа тестирования, эти выводы сохраняют актуальность до сих пор:

1) применение серии одинаковых испытаний к большому количеству испытуемых;

2) необходимость накопления и обработки статистических результатов;

3) установление эталонов оценки.

Важнейшим вкладом Ф. Гальтона в развитие тестологии является разработка и использование методов математической статистики для обработки полученных данных по индивидуальным различиям. Он вводит метод сравнения двух рядов переменных, для оценки этого соотношения используется особая величина – индекс-коэффициент корреляции. Он также изучает взаимосвязь переменных, для чего впервые использует построение линий регрессии одной переменной на другую.

1.2. Особенно заметный вклад в развитие тестирования внесли работы Джеймса Кеттелла (1860 - 1944). Американский психолог разработал около пятидесяти наборов заданий, которые назывались «умственными тестами», практически же это были тесты сенсорного различения и скорости реакции, которые, по мнению Дж. Кеттелла, можно было использовать для измерения интеллекта. Дж. Кеттелл рассматривал тестирование как научный метод и выдвигал ряд требований к проведению тестирования, чтобы результаты были приближены к объективным.

Тесты Дж. Кеттелла были типичными среди большого количества серий тестов, разработанных в последнее десятилетие ХIХ века. Такие серии применялись для школьников, студентов и взрослых людей в Америке повсеместно. В основном они были направлены на измерение простых сенсорных и моторных процессов, хотя их авторы заявляли, что тесты предназначены для измерения интеллекта. Первая проверка этих тестов показала их слабую внутреннюю согласованность и то, что их результаты не соответствовали оценке интеллекта испытуемых независимыми экспертами.

В Европе в это время тесты, например, тесты Э. Крепелина и Г. Эббингауза, были более сложными и объективными.

Дж. Кеттелл активно пропагандировал новые методы измерения. В течение 1895 - 1896 гг. в Америке создаются два национальных комитета, с целью организации тестологов в области теоретических исследований и практики создания качественных тестов и их применения.

Новый этап в развитии тестологии связан с деятельностью французского психолога Альфреда Бине (1857 - 1911). Он разрабатывает оригинальные методики измерения интеллекта. А. Бине не устраивали попытки оценить уровень интеллекта через измерение элементарных психических процессов. Он идет по пути измерения сложных интеллектуальных функций. Работа в Комиссии по изучению методов обучения умственно отсталых детей с 1904 года дала возможность А. Бине реализовать свои идеи на практике. Совместно с Теодором Симоном А. Бине создает тестовые задания, направленные на дифференциацию детей способных к обучению, но ленивых или отстающих, и на детей умственно отсталых.

Шкала Бине-Симона (шкала 1905 года) состояла из 30 заданий, которые были расположены по возрастанию трудности. Уровень трудности был определен по результатам обследования 50 нормальных детей в возрасте от 3 до 11 лет и небольшого числа слабоумных детей. Тесты были рассчитаны на оценку способности к суждению, пониманию и рассуждению, которые, по мнению А. Бине, и являются основными компонентами интеллекта. Вероятность успешного выполнения определялась возрастающей трудностью заданий теста и увеличивалась в зависимости от возраста испытуемого.

В 1908 году появляется новый переработанный вариант шкалы: увеличивается количество заданий, убираются неудачные задания, расширяется выборка стандартизации. Бине и Симон заявляют и новую цель шкалы: теперь это не только дифференциация детей на нормальных и умственно отсталых, но и выделение среди нормальных детей различных возрастных уровней интеллектуального развития. Группировка тестов по возрастным уровням позволила определить нормы для детей разных возрастных категорий. Дальнейшая модификация шкалы была сосредоточена на ее стандартизации и определении ее валидности.

Тесты Бине-Симона привлекли внимание психологов разных стран. Они активно переводились и адаптировались. В Америке появилось много переработанных вариантов тестов Бине-Симона. Одним из удачных вариантов признан тест, разработанный Левисом Мадисоном Терменом (Странфордская шкала интеллекта Бине). В этом варианте был впервые использован коэффициент интеллектуальности - показатель умственного развития (IQ).

Активная работа по созданию, совершенствованию и применению тестов сопровождалась разработкой статистических методов обработки полученных результатов (К. Пирсон, Ч.Спирмен).

В начале возникновения и становления тест как измерительный инструмент использовался только в рамках эксперимента, был предназначен исключительно для индивидуального измерения. Групповые тесты впервые появились в США в 1917 году, когда Америка вступила в Первую мировую войну, и возникла необходимость быстро определить интеллектуальный уровень полутора миллионов вступающих в ряды армии. С этой целью использовались тесты интеллекта Артура Синтона Отиса. Тесты Отиса включали два вида: альфа-вербальный тест для владеющих английским языком и бета-тест – невербальный, рассчитанный на неграмотных и новобранцев иностранного происхождения. По окончании Первой мировой войны после некоторой переработки эти тесты стали повсеместно использоваться как групповые тесты интеллекта в образовательных учреждениях, среди взрослого населения.

В 1915 г. американец Р.М. Йеркс предлагает новую систему подсчета результатов испытуемых. Он вводит балльную систему (за правильное решенное задание теста испытуемый получает определенное количество баллов) вместо возрастных долей, которые использовались А.Бине. Полученное количество баллов затем переводилось в коэффициент одаренности или успешности в соответствии с разработанными стандартами .

2. Психологические и педагогические тесты

В начале ХХ века также возникает идея использования тестирования для измерения уровня учебных достижений. Американский психолог В.А.Макколл предлагает разделить тесты на психологические (определение уровня умственного развития) и педагогические (измерение успешности учащихся по предметам за определенный период обучения). Целью педагогического тестирования, по мысли Макколла, должно быть выделение и объединение учащихся с близкими показателями уровня обученности.

Основоположником педагогических измерений считается американский психолог Эдуард Ли Торндайк, который создал первый педагогический тест (ability tests). Первые тесты учебных достижений представляли собой тесты на решение арифметических задач, правописание, оценку почерка, рассуждение. Свои выводы по использованию тестовых методов в педагогике Торндайк обобщает в книге «Введение в теорию психологии и социальных измерений» (1904).

Между теоретическими положениями, развиваемыми в рамках общей психологии, и основами психодиагностики прослеживается тесная внутренняя взаимосвязь. Представления о закономерностях развития и функционирования психики являются отправным пунктом при выборе психодиагностической методологии, конструировании психодиагностических методик, их использовании в практике.

История психодиагностики -- это и история появления основных психодиагностических методик, и развитие подходов к их созданию на основе эволюционирования взглядов о природе и функционировании психического. В этой связи интересно проследить, как формировались некоторые важные психодиагностические методы в рамках основных школ психологии.

Тест (англ. test -- проба, испытание, исследование) экспериментальный метод в психологии и педагогике, стандартизированные задания, позволяющие измерить психофизиологические и личностные характеристики, а также знания, умения и навыки испытуемого.

Тесты начали применяться в 1864 году Дж. Фишером в Великобритании для проверки знаний учащихся. Теоретические основы тестирования были разработаны английским психологом Ф. Гальтоном в 1883 году: применение серии одинаковых испытаний к большому числу индивидов, статистической обработке результатов, выделение эталонов оценки.

Первый стандартизированный педагогический тест был составлен американским психологом Э. Торнодайком. Развитие тестирования было одной из причин, обусловивших проникновение в психологию и педагогику математических методов.

Американский психолог К. Спирмен разработал основные методы корреляционного анализа для стандартизации тестов и объективного измерения тестологических исследований. Статистические методы Спирмена -- применение факторного анализа -- сыграли большую роль в дальнейшем развитии тестирования.

Значительное распространение тестирование получило в психотехнике для профессионального отбора. Интенсивное развитие психотехники приходится на время 1-й мировой войны 1914-1918 года, когда первоочередными стали вопросы профессионального отбора для нужд армии и военного производства. В связи с этим широкое применение в психотехнике имеет метод тестов.

Наибольшее развитие тестологического исследования получили в США (например, за время 2-й мировой войны с 1939 по 45 год при мобилизации в армию было тестировано около 20 миллионов человек). В России составление и применение тестов относится к 20-м годам прошлого века, в 1926 году была опубликована первая серия тестов для школ.

С конца прошлого века эксперимент стал применяться и в исследовании высших умственных процессов (суждения, умозаключения, мышления), хотя раньше неоднократно высказывалось убеждение, что эксперимент может применяться только к элементарным психическим процессам.

Для чего нужны психологические тесты? Чтобы выяснить, что испытуемый может, а какие задачи пока решить не в состоянии. Для этого в тест вводится определенное содержание в отношении тех знаний и умений, которые будут изучаться.

Составление тестов строится по единой схеме: определение целей тестирования, составление тестов в черновом виде, апробация тестов на репрезентативной выборке испытуемых и исправление недостатков, разработка шкалы измерений (на основе качественных соображений и статистической обработки результатов) и правил интерпретации результатов.

Качество тестов определяется по таким характеристикам, как надёжность, валидность (соответствие полученных результатов цели тестирования), дифференцирующая сила заданий и др.

Валидность теста -- это его психометрическая характеристика, действительная способность теста измерять ту психологическую характеристику, для диагностики которой он заявлен и указывает на степень соответствия получаемой информации диагностируемому психическому свойству.

Количественно валидность теста может выражаться через корреляции результатов, полученных с его помощью, с другими показателями, например, с успешностью выполнения соответствующей деятельности. Совокупность характеристик валидности теста, полученных экспериментально-статистическим способом -- валидность эмпирическая.

Практическое использование тестирования связано главным образом с диагностированием личностных характеристик человека, выражаемых через количественные показатели.

Тестовые методики связаны с теоретическими принципами бихевиоризма. Методологическая концепция бихевиоризма основывалась на том, что между организмом и средой существуют детерминационные отношения. Организм, реагируя на стимулы внешней среды, стремится изменить ситуацию в благоприятную для себя сторону и приспосабливается к ней. Бихевиоризм ввел в психологию в качестве ведущей категорию поведения, понимая его как совокупность доступных объективному наблюдению реакций на стимулы. Поведение, согласно бихевиористской концепции, является единственным объектом изучения психологии, а все внутренние психические процессы должны быть интерпретированы по объективно наблюдаемым поведенческим реакциям. В соответствии с этими представлениями цель диагностики сводилась первоначально к фиксации поведения. Именно этим занимались первые психодиагносты, разработавшие метод тестов (термин введен Ф. Гальтоном).

Первым исследователем, использовавшим в психологической экспериментатике понятие "интеллектуальный тест", был Дж. Кеттелл. Этот термин после статьи Дж. Кеттелла "Интеллектуальные тесты и измерения", опубликованной в 1890 г. в журнале "Mind" ("Мысль"), приобрел широкую известность. В своей статье Дж. Кеттелл писал о том, что применение серии тестов к большому числу индивидов позволит открыть закономерности психических процессов и тем самым приведет к преобразованию психологии в точную науку. Вместе с тем он высказал мысль о том, что научная и практическая ценность тестов возрастет, если условия их проведения будут однообразными. Так впервые была провозглашена необходимость стандартизации тестов для того, чтобы стало возможным сравнение их результатов, полученных разными исследователями на разных испытуемых.

Дж. Кеттелл предложил в качестве образца 50 тестов, включавших различного рода измерения:

· чувствительности;

· времени реакции;

· времени, затрачиваемого на называние цветов;

· времени, затрачиваемого на называние количества звуков, воспроизводимых после однократного прослушивания, и др.

Он применял эти тесты в устроенной им при Колумбийском университете лаборатории (1891). Вслед за Дж. Кеттеллом и другие американские лаборатории начали использовать метод тестов. Возникла необходимость организовать специальные координационные центры по использованию этого метода. В 1895-1896 гг. в США были созданы два национальных комитета, призванных объединить усилия тестологов и придать общее направление тестологическим работам.

Первоначально в качестве тестов использовались обычные экспериментально-психологические испытания. По форме они походили на приемы лабораторного исследования, но смысл их применения был принципиально иным. Ведь задачей психологического эксперимента является выяснение зависимости психического акта от внешних и внутренних факторов, например, характера восприятия от внешних раздражителей, запоминания -- от частоты и распределения повторений и т.д.

При тестировании психолог регистрирует индивидуальные различия психических актов, оценивая полученные результаты при помощи некоторого критерия и ни в коем случае не изменяя условий осуществления этих психических актов.

Новый шаг в развитии метода тестов был сделан французским врачом и психологом Л. Бине (1857-1911), создателем самой популярной в начале XX в. серии интеллектуальных тестов.

До А. Бине тестировались, как правило, различия в сенсомоторных качествах -- чувствительности, быстроте реакции и т. д. Но практика требовала информации о высших психических функциях, обозначаемых обычно терминами "ум", "интеллект". Именно эти функции обеспечивают приобретение знаний и успешное выполнение сложной приспособительной деятельности.

В 1904 г. Министерство образования Франции поручило Бине заняться разработкой методик, с помощью которых можно было бы отделить детей, способных к учению от ленивых и не желающих учиться, от страдающих прирожденными дефектами и не способных учиться в нормальной школе. Нужда в этом возникла в связи с введением всеобщего образования. Одновременно потребовалось создание специальных школ для умственно неполноценных детей. Бине в сотрудничестве с Анри Симоном провел серию экспериментов по изучению внимания, памяти, мышления у детей разного возраста (начиная с трех лет). Проведенные на многих испытуемых экспериментальные задания были проверены по статистическим критериям и стали рассматриваться как средство определения интеллектуального уровня. Причиной, по которой А. Бине вместе с Т. Симоном приступил к разработке первого в истории психодиагностики интеллектуального теста, стал практический запрос -- необходимость создать методику, с помощью которой можно было отделить детей, способных к учению, от страдающих прирожденными дефектами и не способных учиться в нормальной школе.

Первая серия тестов -- Шкала Бине-Симона (Binet-Simon Intelligence Development Echelle) появилась в 1905 г. Затем она несколько раз пересматривалась авторами, которые стремились изъять из нее все задания, требующие специального обучения.

Задания в шкалах Бине были сгруппированы по возрастам (от 3 до 13 лет). Для каждого возраста подбирались определенные тесты. Они считались соответствующими данной возрастной ступени, если их решало большинство детей данного возраста (80-90 %). Показателем интеллекта в шкалах Бине был умственный возраст, который мог расходиться с хронологическим. Умственный возраст определялся по уровню тех заданий, которые мог решить ребенок. Если, например, ребенок, чей хронологический возраст равен 3 годам, решает все задачи для четырехлетних детей, то умственный возраст этого 3-летнего ребенка признавался равным 4 годам. Несовпадение умственного и хронологического возраста считалось показателем либо умственной отсталости (если умственный возраст ниже хронологического), либо одаренности (если умственный возраст выше хронологического).

Вторая редакция шкалы Бине послужила основой работы по проверке и стандартизации, проведенной в Стэнфордском университете (США) коллективом сотрудников под руководством Л. М. Термена (1877-1956). Первый вариант адаптации тестовой шкалы Бине был предложен в 1916 г. и имел так много серьезных изменений по сравнению с основным, что был назван Шкалой интеллекта Стэнфорд-Бине (Stanford-Binet Intelligence Scale). Основных нововведений по сравнению с тестами Бине было два:

1) введение в качестве показателя по тесту коэффициента интеллектуальности (Intelligence Quotient -- IQ), выводящегося из отношения между умственным и хронологическим возрастами;

2) применение критерия оценки тестирования, для чего вводилось понятие статистической нормы.

Шкала Стэнфорд-Бине рассчитана на детей в возрасте от 2,5 до 18 лет. Она состояла из заданий разной трудности, сгруппированных по возрастным критериям. Для каждого возраста наиболее типичный, средний показатель выполнения, был равен 100, а статистическая мера рассеяния, отклонения индивидуальных значений от этого среднего равнялась 16. Все индивидуальные показатели по тесту, попадавшие в интервал, ограниченный числами 84 и 116, считались нормальными, соответствующими возрастной норме выполнения. Если тестовый показатель был выше тестовой нормы (более 116), ребенок считался одаренным, а если ниже 84, то умственно отсталым.

Шкала Стэнфорд-Бине получила популярность во всем мире. Она имела несколько редакций (1937, 1960, 1972, 1986). В последней редакции она применяется и в настоящее время. Показатель IQ, получаемый по шкале Стэнфорд-Бине, на долгие годы стал синонимом интеллекта. Вновь создаваемые интеллектуальные тесты стали проверяться путем сопоставления с результатами шкалы Стэнфорд-Бине.

Следующий этап развития психологического тестирования характеризуется изменением формы проведения тестового испытания. Все тесты, созданные в первом десятилетии XX в., были индивидуальными и позволяли вести опыт только с одним испытуемым. Использовать их могли лишь специально подготовленные психологи, имеющие достаточно высокую квалификацию.

Эти особенности первых тестов ограничивали их распространение. Практика же требовала диагностировать большие массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Поэтому в США в период первой мировой войны появилась новая форма тестовых испытаний -- групповое тестирование.

Необходимость как можно быстрее отобрать и распределить полуторамиллионную армию рекрутов по различного рода службам, школам и училищам заставила специально созданный комитет поручить ученику Л. Термена Отису (1886-1963) разработку новых тестов. Так появились две формы армейских тестов -- Альфа (Army Alpha) и Бета (Army Beta). Первая из них предназначалась для работы с людьми, знающими английский язык. Вторая -- для неграмотных и иностранцев. После окончания войны эти тесты и их модификации продолжали широко применять.

Групповые (коллективные) тесты не только делали реальными испытания больших групп, но наряду с этим допускали упрощение инструктирования, процедуры проведения и оценки результатов тестирования. К тестированию начали привлекаться люди, не имеющие настоящей психологической квалификации, а всего лишь обученные проведению тестовых испытаний.

В то время как индивидуальные тесты, такие, как шкалы Стэнфорд-Бине, в основном применялись в клинике и для консультирования, групповые тесты использовались преимущественно в системе образования, в промышленности и в армии.

Двадцатые годы прошлого столетия характеризовались настоящим тестовым бумом. Быстрое и широкое распространение тестологии было обусловлено прежде всего ее направленностью на оперативное решение практических задач. Измерение интеллекта с помощью тестов рассматривалось как средство, позволяющее научно, а не чисто эмпирически подойти к вопросам обучения, профотбора, оценки достижений и т. д.

На протяжении первой половины XX в. специалистами в области психологической диагностики было создано множество разнообразных тестов. При этом, разрабатывая методическую сторону тестов, они доводили ее поистине до высокого совершенства. Все тесты тщательным образом стандартизировались на больших выборках; тестологи добивались того, что все они отличались высокой надежностью и хорошей валидностью.

Валидизация выявила ограниченные возможности тестов интеллекта: прогнозирования на их основе успешности выполнения конкретных, достаточно узких видов деятельности часто не достигалось. Требовалась, помимо знания уровня общего интеллекта, дополнительная информация об особенностях психики человека. Возникло новое направление в тестологии -- тестирование специальных способностей, которое вначале призвано было лишь дополнить оценки тестов интеллекта, а впоследствии выделилось в самостоятельную область.

Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механических, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи (комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Разрабатывались комплексные батареи способностей для использования при консультировании и распределении персонала. Наиболее известны среди них Батарея тестов общих способностей (General Aptitude Test Battery -- GATB) и Батарея тестов специальных способностей (Special Aptitude Test Battery -- SATB), разработанные Службой занятости США для использования консультантами в государственных учреждениях. Тесты и батареи специальных способностей, различаясь составом, методическими качествами, сходны в одном -- их характеризует низкая дифференциальная валидность. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.

Теоретической основой для построения комплексных батарей способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними -- факторного анализа. Факторный анализ позволял точнее определить и классифицировать то, что называли специальными способностями.

Современное понимание факторного анализа вносит некоторое изменение в ту его трактовку, которая была в 20-40-х гг. XX в. Факторный анализ -- это высшая ступень линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения математической связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще, то же относится и к невысоким коэффициентам корреляции. Поэтому факторный анализ и добываемые посредством этого анализа факторы не всегда верно отражают зависимости между психическими процессами.

Но, пожалуй, главное, что вызывает сомнение, -- это понимание так называемых специальных способностей. Эти способности трактуются не как индивидуальные особенности, возникшие в качестве продукта влияний требований общества на индивида, а как особенности, исконно присущие данной индивидуальной психике. Такая трактовка порождает массу логических трудностей. В самом деле, откуда вдруг сложились и проявились у современного индивида такие способности, о которых даже представления не имели предшествующие поколения? Нельзя же думать, что в психике таятся способности, пригодные для всех грядущих общественных требований.

Сказанное убеждает в том, что к возможностям факторного анализа и к его факторам нужно относиться с большой осторожностью и не считать этот анализ универсальным инструментом изучения психики.

Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях -- тесты достижений. В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияния специальных программ обучения на эффективность решения тестовых заданий. История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845). В Америке тесты достижений используются при отборе сотрудников на государственную службу, начиная уже с 1872 г., а с 1883 г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение первой мировой войны и сразу после нее.

Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэнфордский тест достижений (Stanford Achievement Test -- SAT), впервые опубликованный в 1923 г. С его помощью оценивается уровень обученности в разных классах в средних учебных заведениях. Значительное число тестов специальных способностей и достижений было создано под воздействием практических запросов со стороны промышленности и экономики. Они применялись для профотбора и профессионального консультирования. Дальнейшее развитие тестов достижений привело к появлению в середине XX в. критериально-ориентированных тестов.

История психодиагностики - это и история появления основных психодиагностических методик, и развитие подходов к их созданию на основе эволюции взглядов о природе и функционировании психического. В этой связи интересно проследить, как формировались некоторые важные психодиагностические методы в рамках основных школ психологии.

Тестовые методики связаны с теоретическими принципами бихевиоризма. Методологическая концепция бихевиоризма основывалась на том, что между организмом и средой существуют детерминационные отношения. Организм, реагируя на стимулы внешней среды, стремится изменить ситуацию в благоприятную для себя сторону и приспосабливается к ней. Бихевиоризм ввел в психологию в качестве ведущей категорию поведения, понимая его как совокупность доступных объективному наблюдению реакций на стимулы. Поведение, согласно бихевиористской концепции, является единственным объектом изучения психологии, а все внутренние психические процессы должны быть интерпретированы по объективно наблюдаемым поведенческим реакциям. В соответствии с этими представлениями цель диагност ки сводилась первоначально к фиксации поведения. Именно этим занимались первые психодиагносты, разработавшие метод тестов (термин введен Ф. Гальтоном).

Первым исследователем, использовавшим в психологической литературе термин интеллектуальный тест, был Дж. Кеттелл. Этот термин после статьи Дж. Кеттелла «Интеллектуальные тесты и измерения», опубликованной в 1890 г. в журнале «Mind» («Мысль»), приобрел широкую известность. В своей статье Дж. Кеттелл писал о том, что применение серии тестов к большому числу индивидов позволит открыть закономерности психических процессов и тем самым приведет к преобразованию психологии в точную науку. Вместе с тем он высказал мысль о том, что научная и практическая ценность тестов возрастет, если условия их проведения будут однообразными. Так впервые была провозглашена необходимость стандартизации тестов для того, чтобы стало возможным сравнение их результатов, полученных разными исследователями на разных испытуемых.

Дж. Кеттелл предложил в качестве образца 50 тестов, включавших различного рода измерения:
- чувствительности;
- времени реакции;
- времени, затрачиваемого на называние цветов;
- времени, затрачиваемого на называние количества звуков, воспроизводимых после однократного прослушивания, и др.

Вернувшись в Америку после работы в лаборатории В. Вундта и чтения лекций в Кембридже, он немедленно стал применять тесты в устроенной им при Колумбийском университете лаборатории (1891). Вслед за Дж. Кеттеллом и другие американские лаборатории начали применять метод тестов. Возникла необходимость организовать специальные координационные центры по использованию этого метода. В 1895-1896 гг. в США были созданы два национальных комитета, призванных объединить усилия тестологов и придать общее направление тестологическим работам.

Первоначально в качестве тестов использовались обычные экспериментально-психологические испытания. По форме они походили на приемы лабораторного исследования, по смысл их применения был принципиально иным. Ведь задачей Психологического эксперимента является выяснен независимости психического акта от внешних и внутренних факторов, например характера восприятия - от внешних раздражителей, запоминания - от частоты и распределения во времени повторений и т. д.

Метод тестов получает широкое распространение. Новый шаг в его развитии был сделан французским врачом и психологом А. Вине (1857-1911), создателем самой популярной в начале XX в. серии интеллектуальных тестов.

До А. Вине тестировались, как правило, различия в сенсомоторных качествах - чувствительности, быстроте реакции и т. д. Но практика требовала информации о высших психических функциях, обозначаемых обычно терминами «ум», «интеллект». Именно эти функции обеспечивают приобретение знаний и успешное выполнение сложной приспособительной деятельности.

В 1904 г. Министерство образования Франции поручило А. Вине заняться разработкой методик, с помощью которых можно было бы отделить детей, способных к учению, от страдающих прирожденными дефектами и не способных учиться в нормальной школе. Нужда в этом возникла в связи с введением всеобщего образования. Одновременно потребовалось создание специальных школ для умственно неполноценных детей. А. Бине в сотрудничестве с Т. Симоном провел серию экспериментов по изучению внимания, памяти, мышления у детей разного возраста (начиная с трех лет). Проведенные на многих испытуемых экспериментальные задания были проверены по статистическим критериям и стали рассматриваться как средство определения интеллектуального уровня.

Первая серия тестов - Шкала Бине-Симона (Binet-Simon Intelligence Development Echelle) появилась в 1905 г. Затем она несколько раз пересматривалась авторами, которые стремились изъять из нее все задания, требующие специального обучения. А. Бине исходил из представления о том, что развитие интеллекта происходит независимо от обучения, в результате биологического созревания.

Шкала Бине в последующих редакциях (1908,1911) была переведена на немецкий и английский языки. Самое широкое распространение получила вторая редакция шкалы Бине, которая отличалась тем, что в ней был расширен возрастной диапазон детей - до 13 лет, увеличено число задач и введено понятие умственного возраста. Последняя (третья) редакция шкалы, опубликованная в год смерти А. Бине, не внес ш существенных изменений.

Вторая редакция шкалы Бине послужила основой работы по переводу, адаптации, проверке и стандартизации, проведенной в Стэн-фордском университете (США) коллективом сотрудников под руководством Л. М. Термена (1877-1956). Первый вариант адаптации тестовой шкалы Бине был предложен в 1916 г. и имел так много серьезных изменений по сравнению с основным, что был назван Шкалой интеллекта Стэнфорд-Бине (Stanford-Binet Intelligence Scale). Основных нововведений но сравнению с тестами Бине было два:
- введение в качестве показателя по тесту коэффициента интеллектуальности (Intelligence Quotient - IQ), выводящегося из отношения между умственным и хронологическим возрастом;
- применение нового критерия оценки тестирования, для чего вводится поня тие статистической нормы.

Коэф<(ЙЙдаент/Qбыл предложен В. Штерном, считавшим существенным Недостатком показателя умственного возраста то, что одна и та же разность между умственным и хронологическим возрастом для различных возрастных ступеней имеет неодинаковое значение. Чтобы устранить этот недостаток, В. Штерн предложил определять частное, получаемое при делении умственного возраста на хронологический. Этот показатель, умноженный на 100, он и назвал коэффициентом интеллектуальности. Используя этот показатель, можно классифицировать нормальных детей по степени умственного развития.

Другим нововведением стэнфордских психологов явилось понятие статистической нормы. Норма стала тем критерием, с которым можно было сравнивать индивидуальные тестовые показатели и тем самым оценивать их, давать им психологическую интерпретацию.

Шкала Стэнфорд-Бине рассчитана на детей в возрасте от 2,5 до 18 дет. Она состояла из заданий разной трудности, сгруппированных по возрастным критериям. Для каждого возраста наиболее типичный, средний показатель выполнения был равен 100, а статистическая мера рассеяния, отклонения индивидуальных значений от этого среднего (о) равнялась 16. Все индивидуальные показатели по тесту, попадавшие в интервал х ± а, т. е. ограниченные числами 84 и 116, считались нормальными, соответствующими возрастной норме выполнения. Если тестовый показатель был выше тестовой нормы (более 116), ребенок считался одаренным, а если ниже 84, то умственно отсталым.

Шкала Стэнфорд-Бине получила популярность во всем мире. Она имела несколько редакций (1937,1960,1972,1986). В последней редакции она применяется и в настоящее время. Показатель IQ, получаемый по шкале Стэнфорд-Бине, на долгие годы стал синонимом интеллекта. Вновь создаваемые интеллектуальные тесты стали проверяться путем сопоставления с результатами шкалы Стэнфорд-Бине.

История возникновение тестирования и тестологии.

4. Диагностика детского развития Э. Сеген, А. Бине.

5. Развитие психодиагностики в России. А.Ф. Лазурский, Г.И. Россолимо

Первым этапом применения тестов в мировой практике можно считать период с 80-х гᴦ. XIX в. по 20-е гᴦ. XX в. Это период зарождения и становления тестирования. Теоретические основы тестирования были заложены в середине 80-х гᴦ. XIX в. английским психологом и естествоиспытателем Ф. Гальтоном , который предположил, что с помощью тестов удастся разделить факторы наследственности и влияния среды в психике человека.

Важным вкладом Ф. Гальтона в развитие теории тестов было определение трех базовых принципов, которые используются и по сей день:

1) применение серии одинаковых испытаний к большому количеству испытуемых;

2) статистическая обработка результатов;

3) выделение эталонов оценки.

Ф. Гальтон называл испытания, проводившиеся в его лаборатории, умственными тестами. При этом наибольшую популярность данный термин приобрел после выхода статьи Джеймса Мак-Кина Кеттелла ʼʼУмственные тесты и измеренияʼʼ, опубликованной в 1890 ᴦ.

Огромный вклад в развитие тестологии внес французский психолог Альфред Бине . Его можно считать родоначальником современных тестов, предназначенных для диагностики уровня развития интеллекта. Впоследствии им и парижским врачом Т. Симоном вводится понятие ʼʼумственный возрастʼʼ и соответствующая ему метрическая шкала (1908). Так, в первом десятилетии XX в. в практику внедряется известный тест Бине - Симона, основной задачей которого являлось выявление умственно отсталых детей с последующим их направлением в специальные школы.

Достаточно долгое время тесты развивались как инструмент индивидуальных измерений. Массовый характер тестирования вызвал крайне важно сть перейти от индивидуальных тестов к групповым. В 1917-1919 гᴦ. в США появились первые групповые тесты. Наибольшее применение нашли тесты Артура Синтона Отиса . Основные принципы, использованные при составлении этих тестов, были систематизированы и впоследствии легли в основу всей методологии групповых тестов.

1. Принцип ограничения во времени, т. е. показатель развития прямо зависит от скорости выполнения заданий испытуемым.

2. Принцип детализированной инструкции как в отношении проведения, так и в отношении подсчета.

3. Введены тесты с выборочным методом формирования ответа с указанием подчеркивать наугад в случае незнания или сомнения.

4. Подбор тестов после тщательной статистической обработки и экспериментальной проверки.

Вторым этапом в развитии тестирования можно считать 20-60-е гᴦ. прошлого столетия. В те годы американец В. А. Макколл разделил тесты на педагогические и психологические по определению умственных способностей. Основной задачей педагогических тестов являлось измерение успешности учащихся по тем или иным школьным дисциплинам за определенный период обучения, а также успешность применения определенных методов преподавания и организации.

Разработка первого педагогического теста принадлежит американскому психологу Эдуарду Ли Торндайку . Он считается основоположником педагогических измерений. Первым педагогическим тестом, вышедшим под его руководством, был тест Стоуна на решение арифметических задач. Именно в США тесты успешности для проверки знаний, навыков и умений учащихся по отдельным предметам нашли особенно широкое распространение.

Разработкой и проверкой тестов занимаются специальные государственные службы. Еще в 1900 ᴦ. в США был создан Совет по вступительным экзаменам. В 1926 ᴦ. Совет колледжей разрабатывал тесты для квалификационной и профессиональной оценки деятельности педагога. С 1947 ᴦ. в США существует Служба тестирования, которая считается наиболее представительным научно-исследовательским центром.

Разработка тестов по иностранному языку была также сосредоточена в США и Великобритании. Первый тест по иностранному языку составил Б. Вуд в 1925 г . Его тесты использовались для проведения выпускных экзаменов в нью-йоркских школах и имели в своей структуре задания на выбор ответа по лексике, грамматике и чтению на французском и испанском языках. В 1929 ᴦ. американский психолог В. Хенмон изучил некоторые вопросы технологии составления тестовых заданий тестов успешности. Он разработал тесты для проверки знаний лексики, грамматики, фонетики; умений понимать прочитанное на уровне предложений и абзацев, умений перевода, аудирования, говорения, умения писать сочинения. В. Хенмон разработал также комплексный тест по иностранному языку, который состоял из ряда разделов - субтестов, аналогичных вышеупомянутым изолированным тестам.

Фундаментальным трудом по вопросам тестирования считается монография американского лингвиста͵ методиста и тестолога Р. Ладо ʼʼLanguage testingʼʼ (1961), который, основываясь на тесном взаимодействии обучения и контроля, предложил включить в тест те элементы, которые являются трудными для обучаемых. Р. Ладо считал, что знание этих трудностей и умение преодолевать их дает возможность более качественно изучить язык. Отрицательным моментом его работы было то, что лишь знание дискретных языковых единиц не является целью обучения иностранным языкам, главное - умение использовать их в процессе общения на данном иностранном языке.

Разработка проблемы языкового тестирования прошла несколько этапов. Выделяют переводной, или донаучный, этап, который отождествляется с различными испытаниями в школах писцов Древнего Вавилона и жрецов Древнего Египта; психометрико-структуралистический этап становления тестов под знаком научности (педагогические тесты), который датируется началом XX в. и продолжается до 70-х гᴦ. В 70-е гᴦ. XX в. начинается психолингвистический, а затем, в 90-х гᴦ., коммуникативный этап тестового контроля в обучении иностранным языкам.

В ходе второго и третьего этапов разработки языкового тестирования развивались дискретный и интегративный подходы к тестированию. Дискретный подход отличался от интегративного тем, что при дискретном тестировании проверялось лишь усвоение языкового материала, что не представляло особых трудностей для обработки результатов теста͵ тогда как в интегративных тестах проверялись различные умения использования языкового материала. Видами интегративных тестов являются клоуз-тест (тест на заполнение пропусков в тексте) и диктант, свидетельствующие лишь об уровне сформированности лингвистической компетенции обучаемых.

Период коммуникативного тестирования связан с разработкой проблемы коммуникативной компетенции. Толчком к пересмотру языкового тестирования послужило развитие модели коммуникативной компетенции, включающей 6 уровней владения иностранным языком, предложенной Советом Европы. Исходя из основной цели обучения иностранным языкам - формирование коммуникативной компетенции, в качестве объектов тестирования стали выделять практические умения. Коммуникативный тест призван выявить степень сформированности коммуникативных умений, т. е. способности тестируемого решать экстралингвистические (практические) задачи вербальными средствами.

Сегодня заданные Советом Европы уровни владения иностранным языком служат ориентиром для коммуникативных тестов во многих странах.

В России практическое значение тесты получили после 1925 г ., когда была создана особая тестовая комиссия. Она существовала при педагогическом отделе Института методов школьной работы. В ее задачи входила выработка тестов для советской школы. И уже весной 1926 ᴦ. вышли такие тесты, созданные на базе американских. Были разработаны тесты по природоведению, обществоведению, счету, решению задач, на понимание чтения и проверку умения правописания. К этим тестам прилагались инструкции и личная карточка для учета прогресса учащегося.

Уже в те годы было доказано, что метод тестов позволяет не только охватить отдельные элементарные психические процессы, но может анализировать их совокупности. Вместе с тем, было замечено, что тестовый учет устраняет случайность, субъективность и приблизительность оценки работы с учащимися.

При этом вскоре положение кардинально изменилось. Вышедшее в 1936 ᴦ. постановление ЦК ВКП (б) негативно сказалось на развитии тестологии. Метод тестов был признан орудием дискриминации учащихся и ʼʼизгнанʼʼ из советской школы.

В случае если в отечественной науке исследования в области разработки и применения тестов были приостановлены, то в ряде западных стран они продолжали интенсивно развиваться в различных направлениях. В 30-50-е гᴦ. значительное внимание уделялось так называемым прогностическим тестам, назначению тестов в системе образования, видам тестов и их использованию в практической деятельности. Особую актуальность в это время приобретают вопросы, связанные с разработкой тестов педагогами-практиками.

Следующим этапом в развитии тестирования в России является период с начала 60-х гᴦ. до конца 70-х гᴦ. Реформы по преподаванию ряда предметов, развитие программированного обучения дали значительный толчок к дальнейшему совершенствованию тестов.

Наряду с этим широко начинает внедряться тестирование с помощью компьютеров, что стало возможным благодаря достижениям в области автоматики и кибернетики. Возникновение кибернетики способствовало исследованию обратной связи в обучении. В то же время тестологами был взят на вооружение принцип разветвленного программирования, сущность которого состоит в следующем: если испытуемый ответил правильно, то при следующем шаге ему даются более трудные задания, и наоборот. Было замечено, что при таком подходе создаются благоприятные условия для выявления учащимися своих умственных способностей.

В 60-е гᴦ. начинаются первые, после долгого перерыва, исследования отечественных ученых по использованию тестов психолого-педагогической направленности. В основном в этих выработках анализируется многолетний опыт тестирования, накопленный в зарубежных странах.

С начала 80-х гᴦ. начался новый этап в развитии тестирования в России. Для данного периода характерен ряд особенностей. Прежде всего, важным направлением является интенсивное использование компьютеров как в процессе тестирования, так и при обработке полученных результатов. Наряду с этим в ряде западных стран, особенно в США, тестирование становится практически ведущей формой контроля. Такие страны, как Нидерланды, Англия, Япония, Дания, Израиль, Канада, Австралия, развили теорию и практику тестирования, создали службы разработки тестов, занимаются организацией массового тестирования.

В России сегодня также интенсивно развивается теория и практика педагогических измерений. В обучении иностранным языкам это научные исследования коллектива авторов И. А. Рапопорта͵ Р. Сельг, И. Соттер, которые обобщили зарубежный и отечественный опыт, разработали методологию научного подхода к тестированию, сконструировали тесты и экспериментально их проверили3.

С введением образовательных стандартов, в т.ч. и по иностранным языкам, появилась крайне важно сть упорядочить и объективизировать средства контроля и оценивания для проверки выполнения требований стандартов к уровню подготовки учащихся. С этой целью проводится эксперимент по массовому тестированию по единым контрольным измерительным материалам (Единый государственный экзамен). Это тесты трех уровней сложности (базовый, повышенный и высокий), которые соотносятся с уровнями владения иностранным языком, определенными в документах Совета Европы, следующим образом: базовый уровень - А2+, повышенный уровень - В1, высокий уровень - В2. Для решения научных проблем теории и практики тестирования создан Федеральный институт педагогических измерений.

Итак, история развития тестирования за рубежом и в России показала, что тесты уровня обученности (тесты успешности) являются важным способом оценки педагогической деятельности, с помощью которого результаты учебного процесса бывают достаточно объективно, надежно измерены, обработаны, интерпретированы и использованы в педагогической практике.

История возникновение тестирования и тестологии. - понятие и виды. Классификация и особенности категории "История возникновение тестирования и тестологии." 2017, 2018.