Язык программирования Perl



              

Поддержка Unicode - часть 2


use utf8; $u = "€500"; # знак евро (escape-код \x{20AC}) print "Длина=", length($u), "\n"; # Длина=4 $u = '???'; # коды \x{221E}, \x{2260}, \x{221E} print "Бесконечности не равны\n" if $u eq reverse '???';

Переключить встроенные функции на работу не с символами, а с байтами можно с помощью прагмы use bytes. Снова переключиться на работу функций не с байтами, а с символами можно с помощью прагмы no bytes. Подключив прагмой use Encode стандартный модуль преобразования можно преобразовать обычную строку в строку символов Unicode с помощью функции encode(), возвращающей символьную строку в представлении UTF-8. Обратное преобразование выполняет функция decode():

use Encode; my $cp1251 = 'Привет!'; # строка в кодировке windows-1251 my $utf8 = encode('utf8', $cp1251); # преобразуется в UTF-8 my $win_ru = decode('utf8', $utf8); # и наоборот

Поддержка наборов символов Unicode в Perl имеет свои особенности, связанные с обеспечением совместимости со старыми байт-ориентированными программами, но эти особенности заслуживают отдельного продолжительного разговора за рамками данного учебного курса.

В этой лекции рассмотрены средства работы с символьной информацией в Perl, достаточные для решения типичных задач обработки текста. Но вся прелесть языка Perl и его мощь открываются только тем, кто освоит регулярные выражения, о которых пойдет речь в следующей лекции.




Содержание  Назад  Вперед