Педро задался целью посчитать, сколько же кода из программного обеспечения проекта GNU используется в современных Linux-дистрибутивах. Напомним, что дистрибутивы корректно называть термином «GNU/Linux», чтобы подчеркнуть, что «Linux» — это только ядро, а сам дистрибутив — это ядро Linux с целым комплексом дополнительных приложений, значительная часть которых была разработана в рамках GNU, инициированного Ричардом Столлманом (Richard Stallman) в далеком 1983 году. Объектом своего исследования португалец выбрал последний релиз Ubuntu Linux — 11.04 «Natty Narwhal».
Автор взял основной репозиторий Ubuntu 11.04 («main»), являющийся ядром дистрибутива, и посчитал количество строк кода разных крупных проектов, входящих в его состав. В результате, Педро получил следующий список лидеров:
ядро Linux — 9 процентов;
GNU — 8 %;
KDE — 8 %;
Mozilla — 6 %;
Java — 6 %;
GNOME — 5 %;
Xorg — 3 %;
все остальное — 56 %.
Из этих результатов автор исследования выделяет два интересных вывода:
Размер ядра Linux сопоставим с размером всего программного обеспечения, созданного в рамках GNU.
Небольшие проекты составляют наибольшую часть в GNU/Linux.
Распределение среди проектов внутри самого GNU:
GCC — 32 %;
GDB — 14 %;
binutils — 13 %;
glibc — 9 %;
gettext — 6 %;
emacs — 4%;
GnuPG — 2 %;
GRUB — 2 %;
GSL — 1 %;
libunistring — 1 %;
coreutils — 1 %;
GnuTLS — 1 %;
Mailman — 1 %;
другие — 11 %.
Все вы наверняка прекрасно знаете высказывание про три вида лжи*. Стоит учитывать, что в данной статистике за основу взята весьма условная характеристика — «количество строк кода». Кроме того, при подсчете объема кода никак не учитывается значимость проектов и их роль в функционировании операционной системы.
* Кстати, в одной известной шуточной формулировке оно звучит так: «Есть три вида лжи: ложь, наглая ложь и статистика по количеству Linux-десктопов.