Тут на помощь пришла импульсно-кодовая модуляция (ИКМ, PCM, pulse-code modulation), известная, как утверждает Википедия, с начала XX века. Почитать о ней можно, например, все в той же Википедии.
Для того, чтобы преобразовать аналоговый сигнал в цифровой, необходимо последовательно выполнить над ним три операции: дискретизацию, квантование и кодирование.
Дискретизация — это получение мгновенных значений сигнала (отсчетов) через определенные промежутки времени (т.е. с определенной частотой — частотой дискретизации). На рисунке: (1) — сигнал, (2) — отсчеты.
Квантование — это «округление» полученных мгновенных значений до ближайших заранее заданных уровней. Например, если у нас есть 5 уровней с шагом 2: 0, 2, 4, 6, 8, а некоторые мгновенные значения равны 3.6, 7.1, 2, 0.5, 1.8, то они будут округлены до 4, 8, 2, 0, 2 соответственно.
Кодирование — это представление значений полученных уровней в виде какого-либо кода (например, двоичного).
Теперь рассмотрим, как вышеописанное происходит в цифровой телефонии.
Человеческая речь занимает полосу частот приблизительно 60-12000 Гц, однако для нормальной разборчивости достаточно полосы частот в 300-3400 Гц, т.е. верхняя граница составляет 3.4 кГц. Все, что выше 3.4 кГц «срезается» фильтром, для того чтобы избежать помех в будущем. Согласно теореме Котельникова, частота дискретизации для представления аналогового сигнала, ограниченного по спектру (помним о фильтре), в виде отсчетов должна превышать удвоенную верхнюю частоту сигнала. Для простоты расчетов, а также некоторого запаса, верхняя граница округляется до 4 кГц. Таким образом, частота дискретизации в нашем случае равна 8 кГц.
Квантование и кодирование практически всегда являются неотъемлемыми частями друг друга. Квантование в цифровой телефонии неравномерное, 256-уровневое. Неравномерность квантования выражается в том, что шаг квантования (расстояние между соседними уровнями в единицах измерения характеристики аналогового сигнала, которая квантуется; в данном случае — напряжение сигнала в вольтах) для малых амплитуд выбирается минимальным, для средних — бóльшим и для больших — самым большим. Это сделано для того, чтобы повысить точность передачи сигналов с низкой амплитудой. 256 уровней квантования можно «уместить» в одно 8-разрядное двоичное число, таким образом, один отсчет представляется в виде 8-разрядной кодовой комбинации. Все 256 уровней делятся на две группы: положительные и отрицательные. Для положительных сигналов первый бит в кодовой комбинации равен «1», для отрицательных — «0». Каждая группа делится на 8 сегментов. В пределах одного сегмента шаг квантования неизменный, в то время, как от сегмента к сегменту он меняется, увеличиваясь с возрастанием номера сегмента. Под номер сегмента отводятся следующие 3 бита. Последние 4 бита занимает номер уровня в сегменте, всего этих уровней 16. Итого имеем: 16 уровней × 8 сегментов × 2 группы = 256 уровней.
К примеру, число «10010101» представляет собой положительный сигнал (1), с уровнем 5 (0101) в 1-м сегменте (001).
Теперь можно посчитать скорость полученного цифрового сигнала:
Данные сигналы являются простейшими сигналами в цифровой телефонии. Для их передачи используются основные цифровые каналы со скоростью 64 кбит/с. Также по данным каналам могут передаватьсякомпандированные сигналы, которые имеют большее количество уровней квантования, но тем не менее, после компандирования все равно имеют 8 бит/отсчет.