Linux и UNIX: программирование в shell. Руководство разработчика
Linux и UNIX: программирование в shell. Руководство разработчика читать книгу онлайн
Данная книга является практическим руководством по программированию интерпретатора Bourne shell -cтандартного командного интерпретатора в UNIX, полностью совместимого с интерпретатором BASH shell в Linux. Книга предназначена для начинающих и опытных программистов и содержит множество полезных примеров, советов и подсказок. С ее помощью читатель сможет быстро научиться создавать shell–сценарии для реальных задач и ситуаций, возникающих в большинстве систем UNIX и Linux.
Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних чтение данного контента СТРОГО ЗАПРЕЩЕНО! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту [email protected] для удаления материала
В первом примере осуществляется передача утилите tr строки, содержащей смешанный набор символов.
$ echo "May Day, May Day, Going Down.." | tr " [a‑z]" "[A‑Z]"
MAY DAY, MAY DAY, GOING DOWN..
С другой стороны, можно воспользоваться классами символов [:lower:] и [:upper:].
$ echo "May Day, May Day, Going Down.." | tr ":lower:" ":upper:"
MAY DAY, MAY DAY, GOING DOWN..
Для преобразования прописных букв из текстового файла в строчные и последующего их размещения в новом файле применяется следующий формат:
cat file‑to‑translate | tr "[A‑Z]" "[a‑z]" > new‑file‑name
где параметр 'файл–для–преобразования' — преобразуемый файл, а 'имя–нового–файла' — имя, которое нужно присвоить новому файлу. Например:
cat myfile | tr "[A‑Z]" "[a‑z]" > lower_myfile
12.1.6. Преобразование строчных букв в прописные
Преобразование строчных букв в прописные выполняется в обратном порядке по сравнению с преобразованием, рассмотренным в предыдущем разделе. Ниже приведены два примера подобного преобразования.
$ echo "Look for the route, or make the route" | tr "[a‑z]" "[A‑Z]"
LOOK FOR THE ROUTE, OR MAKE THE ROUTE
$ echo "May Day, May Day, Going Down.." | tr ":lower:" ":upper:"
may day, may day, going down..
Для преобразования строчных букв из текстового файла в прописные и последующего их размещения в новом файле применяется формат:
cat file‑to‑translate | tr "[a‑z]" "[A‑Z]" > new‑file‑name
где 'файл–для–преобразования' - преобразуемый файл, а 'имя–нового–файла' — имя, которое нужно присвоить новому файлу. Например:
cat myfile | tr "[a‑z]" "[A‑Z]" > upper_myfile
12.1.7. Удаление определенных символов
Иногда возникает необходимость в удалении некоторых столбцов из загруженного файла, содержащего только буквы и числа. Для этого в рассматриваемой команде необходимо применить оба параметра, '-с' и '-s'.
Приведенный ниже файл содержит часть составленного на неделю личного календаря. Задача заключается в устранении чисел. В личном календаре остаются в наличии только дни недели. Поскольку дни недели используются в формате как прописных, так и строчных букв, в этом случае применяют оба диапазона символов: [a‑z] и [A‑z]. При этом команда 'tr ‑cs "[a‑z] [A‑z]" "[ 12*]"' выбирает все содержимое файла, которое не находится в пределах [a‑z] или [A-Z] (буквенных символов), содержащихся в строка1, и преобразует их в символы новой строки. В приведенной выше команде tr параметр ' -s' сообщает о необходимости "сокращения" всех символов новой строки, а параметр '-с' сохраняет без изменения все буквенные символы. Ниже приведен файл, содержащий данные личного календаря, после чего следует строка с утилитой tr и результат ее выполнения.
$ pg diary.txt
Monday 10:50
Tuesday 15:30
Wednesday 15:30
Thursday 10:30
Friday 09.20
$ tr -cs "[a‑z][A‑Z]""[Q12*]" < diary.txt
Monday
Tuesday
Wednesday
Thursday
Friday
12.1.8. Преобразование управляющих символов
Чаще всего утилита tr применяется для преобразования управляющих символов, особенно во время загрузки файлов из DOS в UNIX. Если в команде ftp не задан параметр, выполняющий преобразование символов возврата каретки в символы новой строки, обычно применяют утилиту tr.
Ниже приведен текстовый файл, при пересылке которого не было выполнено преобразование символов возврата каретки. Файл содержит часть требования на выдачу канцелярских принадлежностей. Управляющие символы файла отображены ниже с помощью команды cat -v.
$ cat -v stat.txt
Boxes рарег^^^^^^12^M
Clips metal^^^^^^^50^M
Pencils‑medium^^^^^^10^M ^Z
В этом файле последовательность символов '^^^^^^' кодирует символы табуляции, каждая строка завершается управляющей последовательностью control‑m, а в конце файла находится управляющая последовательность Control‑Z. Ниже показано, как можно исправить положение.
В данном случае придется воспользоваться параметром '~s'. Если обратиться к таблице кодов ASCII, то восьмеричный код символа '^' равен 136. Соответствующее значение для управляющей последовательности ^M равно '015', для символа табуляции — '011', а для управляющей последовательности ^Z — '032'. Данная задача выполняется поэтапно.
Для замены в рассматриваемой команде последовательности символов '^^^^^^' символами табуляции используется следующий шаблон: "136" "[ 11*]". Затем полученные результаты перенаправляются во временный рабочий файл с именем stat.tmp.
$ tr -s '[136]" "[ 11*]" < stat.tr > stat.tmp
Boxes paper 12^M
Clips metal 50^M.
Pencils‑medium 10^М
^Z
Для замены управляющих последовательностей ^M, расположенных в конце каждой строки, символом новой строки и устранения управляющей последовательности ^Z применяется шаблон n. Не следует забывать, что входные данные поступают из временного файла stat.tmp.
$ tr -s "[ 15 32]" "n" < stat.tmp
Boxes paper 12
Clips metal 50
Pencils‑medium 10
Таким образом, управляющие символы удаляются и файл готов к применению.
12.1.9. Быстрые преобразования
Если из файла необходимо удалить только управляющие последовательности ^M и заменить их символами новой строки, для этого применяется команда:
$ tr -s "[ 15]" "n" < файл_ввода
С другой стороны, для получения аналогичного результата можно воспользоваться командой:
$ tr -s "[r]" "[n]" < файл_ввода
То же самое преобразование можно выполнить и с помощью команды:
$ tr -s "r" "n" < файл_ввода
Еще один распространенный вариант преобразования файлов, перенесенных из DOS в UNIX, иллюстрирует команда:
$ tr -s "[ 15 32]" "[ 12*]" < файл_ввода
Эта команда удаляет управляющие последовательности ^M и ^Z и заменяет их символами новой строки.
Следующая команда удаляет символы табуляции, заменяя их пробелами:
$ tr -s "[ 11]" "[ 40*]" < файл_ввода
Для замены в файле пароля passwd всех двоеточий символами табуляции, двоеточие следует заключить в кавычки и указать в строке замены восьмеричное значение символа табуляции, которое равно '011'. Файл станет более удобным для чтения. Сначала приводится файл passwd, а затем команда с утилитой tr, которая выполняет задачу.
$ pg passwd
halt:*:7:0:halt:/sbin:/sbin/halt
mail:*:8:12.mail:/var/spool/mail:
news:*:9:13:news:/var/spool/news:
uucp:*:10:14:tmcp:/var/spool/uucp:
$ tr -s "[:]" "[ 11]" < passwd
halt
*
7
0
halt
/sbin /sbin/halt
*
8
12
/var/spool/mail
news
*
9
13
news
/var/spool/news
uucp
*
10
14
uucp
/var/spool/uucp
С другой стороны, аналогичного результата можно добиться с помощью следующей команды, где указывается сокращенная запись символа табуляции:
$ tr "[:]" "[t]" < passwd
12.1.10. Сравнение с несколькими символами