这里以debian为例,介绍在stable版本下Anjuta 1.2.2的安装与使用方法。
1.安装:
1.1 anjuta主包

anjuta
A GNOME development IDE, for C/C++

anjuta-common
Data files for Anjuta

1.2 anjuta运行和使用需要的相关包


debhelper (>= 4.1.0)
helper programs for debian/rules

cdbs
common build system for Debian packages

gcc (>= 4:4.0.0)
The GNU C compiler

libpcre3-dev
Perl 5 Compatible Regular Expression Library - development files

libgnomeprintui2.2-dev
GNOME 2.2 print architecture User Interface - devel files

libgnomeprint2.2-dev
The GNOME 2.2 print architecture - development files

libvte-dev
Terminal emulator widget for GTK+ 2.0 - development files

libzvt2.0-dev
The GNOME 2 zvt (zterm) widget - development files

libglade2-dev
development files for libglade

libgnomeui-dev
The GNOME 2 libraries (User Interface) - development files

scrollkeeper
A free electronic cataloging system for documentation

automake
Virtual package

libxml-parser-perl
Perl module for parsing XML files
1.3用apt-get或aptitude install 来安装


2.anjuta的使用

2.1运行 anjuta:
在终端下输入anjuta &或Applications==>programming==>anjuta
将出现以下界面:
这个blog在debian(stable)版本下要手写html代码.:)
2.2使用 anjuta
请看help文档。
2.3关于Project和messages窗口docked
默认情况下都是docked的,即嵌在anjuta的主窗口下,如果被拆开了,对于project窗口:
Project==>docked
对于messages窗口
点信息窗口的下面tab标签,右击,选取docked
这样就恢复成以前docked状态了。
 
 

原文出处:http://chinajz.spaces.live.com/blog/cns!EAD556F11EFE5C17!160.entry

Posted on September 20, 2006 2:13 AM | | Comments (0) | TrackBacks (0)

在LINUX社区看到有一个Anjuta的东东,想了解一下是什么东西,在百度搜了一下,随手将两篇贴了过来,以此存照! 

  Redhat linux上面没有提供Anjuta软件包,上面提供了一个Glade应用程序界面设计工具。Linux上面使用Anjuta和Glade以及 Glademm软件包可以搭建一个linux下面进行C/C++软件开发的IDE环境,可以进行GTK+/Gnome的应用程序开发。

  以前开发 Linux 程序时写出好的图形化用户界面比较难。在 GIMP 工具包 (GTK)诞生之后,这件事就变得比较容易了。当Damon Chaplin 写出 GLADE 这个用于在 GTK 环境下生成图形化用户界面的工具后,就更容易了。但是GLADE 仍然不能算是一个“集成开发环境”(如 Visual Basic 等等.),因为程序员不能在 GLADE 的环境下手动修改 GLADE 产生的代码。现在,这一切都已成为过去: Anjuta诞生了!

  Anjuta 利用 GLADE 生成优美用户界面的能力,加之以自己强大的源程序编辑能力,正成为一个极好的应用程序快速开发的集成环境(IDE)。以前,人们使用 GLADE 做界面,用 emacs 或 vi 等等编辑程序,再用某种终端模拟器编辑开发项目。使用 Anjuta,所有这些繁杂零散的任务都可以在一个统一的、集成的、自然而然的环境下完成。

  一、软件准备:

  下载libzvt-2.0.1-0.ximian.6.6.i386.rpm

  http://tux.cprm.net/pub/ximian/x ... ximian.6.6.i386.rpm

  下载anjuta-1.1.97-1.rh90.i386.rpm

  http://rpm.pbone.net/index.php3/ ... .rh90.i386.rpm.html

  下载anjuta-1.0.2-1.i386.rpm

  http://heanet.dl.sourceforge.net ... ta-1.0.2-1.i386.rpm

  下载gtkmm2-2.2.3-fr1.i386.rpm

  http://ftp.freshrpms.net/pub/fre ... -2.2.3-fr1.i386.rpm

  下载gtkmm2-devel-2.2.3-fr1.i386.rpm

  http://ftp.freshrpms.net/pub/fre ... -2.2.3-fr1.i386.rpm

  下载libsigc++-1.2.5-fr1.i386.rpm

  http://ftp.freshrpms.net/pub/fre ... -1.2.5-fr1.i386.rpm

  下载glademm-1.1.3d-SNAP.i586.rpm

  http://loban.caltech.edu/gchch/glademm-1.1.3d-SNAP.i586.rpm

  下载libsigc++-devel-1.2.5-fr1.i386.rpm

  http://ftp.freshrpms.net/pub/fre ... -1.2.5-fr1.i386.rpm

二、安装软件包

  安装redhat linux 9选择安装上软件开发项,这样就安装上了Glade,然后以root用户登陆,安装如下软件包。

  rpm -ivh libzvt-2.0.1-0.ximian.6.6.i386.rpm //anjuta的依赖软件包
  rpm -ivh ibsigc++-1.2.5-fr1.i386.rpm
   rpm -ivh gtkmm2-devel-2.2.3-fr1.i386.rpm
  rpm -ivh ibsigc++-devel-1.2.5-fr1.i386.rpm
  rpm -ivh gtkmm2-2.2.3-fr1.i386.rpm
  rpm -ivh glademm-1.1.3d-SNAP.i586.rpm
  rpm -ivh anjuta-1.0.2-1.i386.rpm
  rpm -Uvh anjuta-1.1.97-1.rh90.i386.rpm

  注:直接安装anjuta-1.1.97会发现无法编译软件,这里要注意的几个问题

  1、要安装 Ximian版本的 libzvt 软件包,就是要安装我上面提到那个
  2、要先安装 Anjuta 1.0.1,然后才updated via rpm -Uvh Anjuta 1.1.97

  三、进行开发第一个Anjuta1.1.97上的C/C++的程序

  让我们先用 Anjuta 建立一个简单的Hello World 程序.

  建立一个新的项目

  先请打开 Anjuta。请选择菜单项 编程-> 更多编程工具-->Anjuta IDE。GNOME应用程序精灵 "GNOME2.0 Application Wizard" 将会出现。尽管人们只要点击“下一个”(Next)按钮就可以,而不必去管精灵对话框上有些什么信息,这里还是希望您能读一下对话框上的每一条信息。现在,在您读完精灵第一步的对话框上的信息后,请按Next 按钮。

  第二步非常关键。这里您需要决定您要建立的应用程序的类型。让我们选择 "Gnome2.0 project" ,然后继续走下去。第三步要确定应用程序的基本配置。请非常仔细地填入应用程序的配置信息。在本教程中,请输入以下信息。

  项目名称: HelloWorld(程序项目名)注意项目名称中间不能有空格
  程序版本: 0.1(版本号)
  程序作者: (你的名字)
  程序名称: helloworld(程序名)
  程序语言: 有C,C++和C/C++三种选择,这里选择C
  程序类型: 有三种选择可执行程序,动态链接库和静态链接库.

  下面第四步编写项目的描述信息;

  第五步是项目的其他选项,GNU版权声明和程序的本地化支持项,如果您不想要,您可以去除他们。您最好为本应用程序项目选择一个图标,该图标将会出现在GNOME 应用程序菜单中。这里我们选取 Hello World example作为项目名,在 Group 域选取 Applications。最后点击 Next 按钮和 Finish 按钮。这时本应用程序项目就建立起来了。

  因为我们只是在建立一个例子程序,我们可以轻松前行。如果我们是在建立一个要在现实世界使用的应用项目,那我们在填写应用程序精灵每一步的参数时可要格外小心,因为它们对您的应用程序项目来说非常重要。

设计用户界面

  在与应用程序精灵对话结束之后,Anjuta 就开始建立您的应用程序项目的目录结构,运行参数配置脚本并建立应用项目本身。整个创建过程的进行情况显示在 Anjuta 开发环境的下部。创建过程结束后,屏幕的左边示出应用项目树结构。这个树结构中包含您的源程序文件,说明文件和图形文件。

screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://www.yesky.com/image20010518/79518.jpg');}" onmousewheel="return imgzoom(this);">

  现在是启动 GLADE 并用其设计图形用户界面的时候了。请到菜单项 项目->编辑图形界面 去运行 GLADE。您将看到三个窗口: 1) Glade 主窗口,2) 属性窗口,and 3) 绘图工具窗口。

  取一个简单的 GTK 视窗就行了。请点击 Glade 主视窗上列出的第一项 (hello_app), 然后按 Del 删除键。现在到工具视窗(Palette),点击第一个图标。这时一个空白的 GtkWindow 建起来了。这将是我们的应用程序的主视窗 window1。再到属性视窗(Properties),敲入标题“Hello World!”。现在再到工具视窗上选取一个表格(table)2行2列放到主视窗 window1 上。这样,主视窗被切分为同等大小的4个部分。

  现在再从工具视窗中取出两个按钮,分别加到主视窗下面的两个框中。再把这两个按钮的名字和标签属性设置如下:

  左按钮:
  名字: BT_OK
  标签: OK
  右按钮:
  名字: BT_EXIT
  标签: Exit

  在视窗的上半部,左边再加上一个标签控件;在上半部右边加上一个输入框 Entry 控件。该输入框的名字取为 ENTRY。将上述标签控件的标签属性置为 'What's your name,sir?'。

现在在属性视窗的属性档(Signals tab)上把两个按钮都和 Clicked事件连接起来。使用GLADE预设的反向调用函数名。请不要忘记点击 Add 按钮。这种常见的错误会导致产生空白的 callbacks.c 文件。在源文件callbacks.c上,我们将会通过 Anjuta界面加入 源代码。

  现在,主视窗看起来似乎不那么漂亮。您可以试试改变视窗的宽度和高度,以及试试改改水平和垂直包容框的几个属性,看看能不能让视窗好看些。(注意:您可到菜单View,选择控件树,然后选择控件。) 下面是一些属性的设置:

  *将下面的水平包容框的属性 Homogeneous 置为Yes;
  *将属性视窗的定位档的按钮的属性 Fill 置为 Yes;
  *将主视窗 window1 的属性 Grow 置为No.

  把这些属性改来改去后,我的主视窗的样子如下:
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://www.yesky.com/image20010518/79519.jpg');}" onmousewheel="return imgzoom(this);">


  设计好界面后,在Glade主视窗上点击“存盘”按钮,然后再点击“联编”按钮. 这就按您新设计的界面更新了您的 应用项目的src目录下的源文件 interface.c。现在,让我们选菜单 Project -> Exit,回到 Anjuta 用户界面下。开始编程啦!

  编辑程序

  现在回到 Anjuta 环境中来,您应该可以在屏幕左边的项目源程序列表中看到 callbacks.c. 双点击打开该程序. 这样我们在Anjuta集成开发环境的左边就可以编辑该程序了。

  有时一事物如果是有色彩的话就会变得更容易理解、更有趣。Anjuta 的“语法强调色”功能 (在“Format”菜单上)就属于这种情况. Anjuta还有很多很多有用的功能,您可以慢慢品玩。也许现在花点时间熟悉熟悉这个集成环境是很有好处的。

  现在回到 callbacks.c 文件,我们看到两个反向调用函数: on_BT_OK_clicked 和on_BT_EXIT_clicked. 让我们在第二个函数中加入一个函数调用:gtk_main_quit()。这样,该函数变成:

  #ifdef HAVE_CONFIG_H
  #include
  #endif
  #include
  #include "callbacks.h"
  #include "interface.h"
  #include "support.h"
  void on_BT_OK_clicked(GtkButton *button, gpointer user_data)
  {
gtk_main_quit();
  }

这个函数调用的目的是当用户点击退出按钮时,整个应用程序会结束。与此相仿,我们在 on_BT_OK_clicked函数中加入下列函数调用:


  void on_BT_OK_clicked (GtkButton *button, gpointer user_data)
  {
GtkWidget *entry = lookup_widget(GTK_WIDGET(button),"entry1"); // "entry1" 的名字要跟你在Glade 里起的名字一致
GtkWidget *msgbox = gnome_app_new("Hello World","Hello World");
gchar *text1,*text2;
char hello[30]="Hello,"; // Gnome-cn上的程序有错误,就是因为少了hello这个变量
text1 = gtk_entry_get_text( GTK_ENTRY(entry) );
text2 = strcat(hello, text1);
gnome_app_message(GNOME_APP(msgbox),text2);
  }

  生成目标代码,执行,以及发行。

  现在到了测试您程序的时候了;这一定很有趣。先选择菜单项创建->创建项目。这时Anjuta就开始编译和链接项目里的源程序main.c, interface.c, support.c and callbacks.c,然后将产生的可执行文件hello放到 src 目录。编译器一般会用 gcc。

  如果您幸运,编译过程没有任何错误信息的话,请选菜单项“创建->执行程序”于是Anjuta开辟一个终端视窗,并在其上运行您的应用程序 HelloWorld! 请在输入框上输入您的名字,然后点击 OK 按钮。希望这时您的应用程序回您一个问候:Hello ... 您可再敲入一个问候词,然后点退出按钮 Exit,看看程序能否正常退出。如果正常退出,那真好! 您的辛勤劳动终于有了结果!

  这时您可把您的应用程序安装到视窗系统中去:选菜单项 创建->安装尽管您现在也许并不想为您的应用程序创建一个tarball文件,但也许以后您要发行软件时就需要这样做了。在发行应用程序前,务必要填好 TODO,ChangeLog,INSTALL 和 README 这几个文件。要创建一个应用程序的发行版,请点击 创建->创建发行套件 创建过程也许会持续几秒钟,最终会在 /home/(username)/Projects/helloworld/ 目录下建立一个文件 helloworld-0.1.tar.gz。作者: 张善友

Posted on September 20, 2006 2:08 AM | | Comments (0) | TrackBacks (0)

LINUX下PHP+MYSQL+APACHE配置过程

需要软件如下:
apache: http://www.apache.org
mysql: http://www.mysql.com
php: http://www.php.net/downloads.php
gd: http://www.boutell.com/gd/#buildgd
ZendOptimizer http://www.zend.org/products/zend_optimizer
Gettext http://ftp.gnu.org/pub/gnu/gettext/
netpbm http://sourceforge.net/projects/netpbm/
所用的软件版本如下:
Redhat Enterprise As 4
(apache)httpd-2.0.50.tar.gz
mysql-standard-5.0.18-linux-i686.tar.gz
php-5.1.2.tar.gz
gd-2.0.33.tar.gz
ZendOptimizer-2.6.2-linux-glibc21-i386.tar.gz
Imap
Gettext

一.安装MYSQL mysql-standard-5.0.18-linux-i686.tar.gz
我把他全部下载到/usr/local/software目录下
进入安装包目录:cd /usr/local/software
1、[root@localhost software]# chmod 755 mysql-standard-5.0.18-linux-i686.tar.gz
2、[root@localhost software]# tar xfz mysql-standard-5.0.18-linux-i686.tar.gz
解压后生成mysql-standard-5.0.18-linux-i686目录,我们进入该目录:
3、[root@localhost software]# cd mysql-standard-5.0.18-linux-i686
进入后就开始配置mysql了,配置过程中我们要给mysql设置一个
安装目录,我们设置在 /usr/local/mysql 下,以为把文件放到一个地方比较容易管理,如果你还想获得更多的配置信息,使用 ./configure --help:
在这里我要特别强调在编译的时候要选择好MYSQL的默认编码,因为如果不选择按默认安装的时候在JSP中就不支持GBK编码了
所以我这样编译
访问mysql要一个专门的用户,而且必须给相应的访问权限,这里我们就设置root和mysql有权限访问.
7、我们先建立一个mysql和mysql用户来访问mysql:
[root@localhost mysql-standard-5.0.18-linux-i686]# groupadd mysql #建立mysql组
8、[root@localhost mysql-standard-5.0.18-linux-i686]# useradd mysql -g mysql #建立mysql用户并且加入到mysql组中
9、建立用户后我们就初始化表 (注意:必须先执行本步骤后才能进行以下步骤)
[root@localhost mysql-standard-5.0.18-linux-i686]# ./scripts/mysql_install_db --user=mysql
#初试化表并且规定用mysql用户来访问初始化表以后就开始给mysql和root用户设定访问权限,;
10、[root@localhost mysql-standard-5.0.18-linux-i686]# mv mysql-standard-5.0.18-linux-i686 /usr/local/mysql
然后设置权限
cd /usr/local/mysql

11、[root@localhost mysql]# chown -R root . #设定root能访问/usr/local/mysql
12、[root@localhost mysql]# chown -R mysql data #设定mysql用户能访问/usr/local/mysql/data ,里面存的是mysql的数据库文件
13、[root@localhost mysql]# chgrp -R mysql . #设定mysql组能够访问/usr/local/mysql
14、设置完成后,基本上就装好了,好了,我们运行一下我们的mysql:
[root@localhost mysql]# /usr/local/mysql/bin/mysqld_safe --user=mysql &
如果没有问题的话,应该会出现类似这样的提示:
[1] 42264
# Starting mysqld daemon with databases from /usr/local/mysql/var

这就证明你安装成功了
用如下命令修改root密码,默认安装密码为空,为了安全你必须马上修改
15、/usr/local/mysql/bin/mysqladmin -uroot password xksoft321
现在修改的密码为:xksoft321
16.设置开机自动启动
cp support-files/mysql.server /etc/init.d/



二、安装apache
进入安装包目录:cd /usr/local/software
1、# chmod 755 httpd-2.0.50.tar.gz
2、# tar xfz httpd-2.0.50.tar.gz
3、# cd httpd-2.0.50
开始配置APACHE
4、#./configure --prefix=/usr/local/apache2 --enable-so --enable-rewrite --enable-mods-shared=most
# ./configure --prefix=/usr/local/apache2 --enable-so --enable-module=most --enable-shared=max --enable-rewrite
# ./configure --prefix=/usr/local/apache2 --enable-so --enable-rewrite --enable-access
#./configure --prefix=/usr/local/apache2 --enable-so --enable-mods-shared=all –-enable-rewrite=shared

5、# make
6、# make install
7、察看编译进apache的模块:
# /usr/local/apache2/bin/httpd -l
compiled-in modules:
http_core.c
mod_so.c
看到以上的信息表明apache支持dso方式了。这样就可以用dso的方式把php和resin的模块加进来。

三、安装GD
进入安装包目录:cd /usr/local/software
1、tar -zxvf gd-2.0.33.tar.gz
2、cd gd-2.0.33
3、./configure --prefix=/usr/local/gd2
4、make
5、make install

Gettext
1 .tar xfz
2 cd
3 ./configure –with-prefix=/usr/local/gettext
4 make
5 make install

四、安装php
进入安装包目录:cd /usr/local/software
1、# tar xfz php-5.1.2.tar.gz
2、解压后进入目录:
# cd php-5.1.2
3、进行配置,这一步比较关键,一定要设置好,特别是要考虑到你要支持什么,比如GD库,xml,mysql等等,如果想知道详细的配置,执行 ./configure --help来获得:
# ./configure --enable-mbstring=LANG --with-mysql=/usr/local/mysql --with-gd=/usr/local/gd2 --with-apxs2=/usr/local/apache2/bin/apxs –with-gettext=/usr/local/gettext
――enable-mbstring=LANG(解决php extension:mbstring的问题)
如果上面的配置没有错误的话,那么应该最后会显示感谢使用PHP等字样,那么证明配置成功,如果上面的配置选项不支持的话,会提示错误.
比如你没有安装mysql,那么--with-mysql就无法使用,所以一定要注意对应选项系统是否能够支持,如果出现错误,那么就先安装对应的程序,或者去掉相关选项,配置之后就进行编译:
4、# make
编译成功后出现"Build complete."字样,那么就可以进行安装了:
5、# make install
6、安装完成后把php.ini-dist复制到/usr/local/lib/,并重命名为php.ini
# cp php.ini-dist /usr/local/lib/php.ini
基本到这里PHP就安装成功了,如果中间出现错误,除了在配置的时候没有选对选项之后一般都不出现错误.
7、为了让Apache能够直接解析php,我们还要进行一些配置.
# vi /usr/local/apache2/conf/httpd.conf
在httpd.conf文件中,添加(应该将以下两句添加在其他AddType之后)
AddType application/x-httpd-php .php .phtml
AddType application/x-httpd-php-source .phps
确保文件中有以下一句话,没有就自己添加在所有LoadModule之后:
LoadModule php5_module modules/libphp5.so
把index.php加入以下DirectoryIndex后面
DirectoryIndex index.php index.html index.html.var
好了,在vi中使用":wq"保存httpd.conf文件,退出vi。
8、启动apache server:
# /usr/local/apache2/bin/apachectl restart
现在apache就能够运行php了,写个文件测试一下,在/usr/local/apache2/htdocs目录下,新建一个phpinfo.php文件,
文件中只有一行代码:
<? phpinfo(); ?>
保存此文件, 在你的浏览器中输入http://localhost/phpinfo.php,你应该看到PHP的系统信息。
如果出现错误,比如提示你下载phpinfo.php,那么apache就是还无法解析php文件,那么请仔细检查以上的操作是否正确.

五、ZendOptimizer
进入安装包目录:cd /usr/local/software
1、# tar xfz ZendOptimizer-2.6.2-linux-glibc21-i386.tar.gz
2、# cd ZendOptimizer-2.6.2-linux-glibc21-i386
3、# ./install.sh
4、问Confirm the location of your php.ini file的时候打入/usr/local/lib/
问Are you using Apache web server?的时候选YES

六、
1、./configure --prefix=/usr
2、make
3、make check
4、make install



随系统启动服务配置
如果要在计算机启动的时候就运行httpd服务,可以在/etc/rc.d/rc.local文件中加入这几行:
#start apache
/usr/local/apache2/bin/apachectl start

如果启动不了,请给相应的启动脚本可执行权限
比如apache启动不了 chmod a=x apachectl


为了以后操作不要输入类似/usr/local/apache2/bin的路径,在/etc/profile文件中添加$PATH变量
把apache、tomcat和mysql的路径都加上


附:
一、建立resin和apache的虚拟主机
例如建立的是tes1.jsp.com test2.jsp.com 两个虚拟主机

vi /usr/java/httpd2/conf/httpd.conf
复制如下内容到httpd.conf里
NameVirtualHost 192.168.0.* 虚拟主机建立所在的IP
<VirtualHost 192.168.1.*>
DocumentRoot /home/jsp1/ 文件所在目录
ServerName tes1.jsp.com 访问的域名
</VirtualHost>
VirtualHost 192.168.1.*>
DocumentRoot /home/jsp2/
ServerName test2.jsp.com
</VirtualHost>
vi /usr/java/resin/conf/resin.conf
查找如下代码并修改:

<host id="" root-directory=".">
<!--
- configures an explicit root web-app matching the
- webapp's ROOT
-->
<web-app id='/' document-directory="/usr/java/httpd2/htdocs"/>
</host>
<host id='tes1.jsp.com'>
<web-app id='/' document-directory="/home/jsp1"/>
</host>
<host id='tes2.jsp.com'>
<web-app id='/' document-directory="/home/jsp2"/>
</host>
保存从启apache和resin
tes1.jsp.com 和tes2.jsp.com 虚拟主机可以运行了
可以做如下测试http://localhost/caucho-status/
可以看到测试面上有
Virtual Host: tes1.jsp.com:80
Virtual Host: tes2.jsp.com:80
证明JSP虚拟主机工作很正常
二、linux软件安装
从网站或者是光盘上找到的Linux软件包,常见的格式包括有rpm,deb,tar,gz,tgz,zip,bz2等等。我们平时用的最多的恐怕是 rpm和tgz了,据统计,在网上最流行的版本应改是redhat和mandrake了,而这两个版本都是用rpm封装
的,tar是最通用的软件包格式,几乎每个linux软件都会提供tar的格式的软件包,因为这种格式的软件包任何版本的linux都支持,所 以大家至少要了解tar和rpm的使用方法。至于deb可用alien工具转换成tgz或rpm方式。bz2可用bunzip2解包即可。
1、RPM文件的安装
RPM是RedHat Package Manager(RedHat软件包管理工具)的缩写,这一文件格式名称虽然打上了RedHat的标志,但是其原始设计理念是开放式的,现在包括 OpenLinux,mandrake及Turbo Linux等Linux的分发版本都有采用,可以算是公认的行业标准了。
RPM文件在Linux系统中的安装最为简便。以著名的图像处理软件XV为例:
在Terminal中,基本的安装指令如下:
rpm -i xv-3.10a-13.i386.rpm
如果你的连网速度足够快,也可以直接从网络上安装应用软件,只需要在软件的文件名前加上适当的URL路径:
rpm -i ftp://ftp.trilon.com/pub/xv/xv-3.10a-13.i386.rpm
作为一个软件包管理工具,RPM管理着系统已安装的所有RPM程序组件的资料。我们也可以使用RPM来卸载相关的应用程序。
rpm -e xv
RPM的常用参数还包括:
-vh:显示安装进度;
-U:升级软件包;
-qpl:列出RPM软件包内的文件信息;
-qpi:列出RPM软件包的描述信息;
-qf:查找指定文件属于哪个RPM软件包;
-Va:校验所有的RPM软件包,查找丢失的文件;
更为详尽的参数及其用法可以查看RPM的帮助文档。
在X-Window中,RPM文件的图形化安装及管理方式对用户来说,显得更为友好。在kde上先安装好kpackage后,安装rpm仅仅是按一下鼠标就可以了,比windows 98更方便。但是这必须先安装kde.
我还是介绍更常用的方法吧,仍以XV软件为例,在Linux的文件管理器中找到xv-3.10a-13.i386.rpm文件之后,用鼠标右击它,在弹出菜单中就可以找到专为RPM软件包准备的三个指令:Show Info、Upgrade、Install。
选择“Show Info”之后,我们将可以看到如图所示的软件包信息窗口。窗口分为三个部分,顶端显示的是软件名、大小、创建及安装日期以及开发者网站等相关信息;在中 间的方框内,是关于软件的概述;而下面显示的则是软件包内包含的所有文件及其路径信息,它会告诉你软件包内的各个文件将被安装到系统的哪些目录中,
留意这些信息的好处是,你可以很容易地找到启动程序的路径。
此时点击底部的“Install”或者“Upgrade”按钮之后,将开始进行软件的安装或者升级,此时还会弹出一个提示安装进度的窗口。
RPM软件包较之于其他类型的软件包,有着许多优势,但是并不是说RPM软件的安装都是一帆风顺的。常见的错误包括***图安装一个已经安装好了的软件、 所要安装的软件需要其他软件或者系统库文件的支持(此时应该先行安装这些相关软件或者系统库文件)等,情形都和Windows类似。

2、tar的安装
tar.gz、tar.Z、tgz、bz2等文件格式要先解压为tar后再用tar解包安装。解压缩及解包指令举例简述如下:
1.解xv.tar.gz:tar zxf xv.tar.gz
2.解xv.tar.Z:tar zxf xv.tar.Z
3.解xv.tgz:tar zxf xv.tgz
4.解xv.bz2:bunzip2 xv.bz2
5. 解xv.tar:tar xf xv.tar
解包后得到的一堆文件,通常都会存放在一个目录里面。视软件作者的不同,有些会是已经编译好的程序,更多的则是需要自己再行编译的源代码。进入相应目录 后,使用“ls -F -color”指令,可执行程序将会以带“*”标记的亮绿色显示,对于已编译好的程序,直接键入带路径的指令行即可运行程序。
建议解压后先阅读说明文件,应该先用vi等文书编辑器阅读一下软件目录中的Readme、Install等重要的相关文档,在这里你会找到软件详尽的编译步骤及注意事项,可以了解安装有哪些需求,有必要时还需改动编译配置。
有些软件包的源代码在编译安装后可以用make install命令来进行卸载,如果不提供此功能,则软件的卸载必须手动删除。由于软件可能将文件分散地安装在系统的多个目录中,往往很难把它删除干净, 那你应该在编译前进行配置,指定软件将要安装到目标路径:./configure --prefix=目录名,这样可以使用“rm -rf 软件目录名”命令来进行干净彻底的卸载。与其它安装方式相比,需要用户自己编译安装是最难的,它适合于使用Linux已有一定经验的人,一般不推荐初学者 使用。
通常的编译步骤会是这样:
./configure
make
make install(需要取得root身份才能执行此指令)
卸载可用:make uninstall 或 手动删除
编译完成之后,在当前目录或者是名为src的子目录下,可以很容易地发现软件的可执行程序。至此,软件的安装便告一段落。

3、关于src源代码文件包
Linux软件的源代码src是指提供了该软件所有程序源代码的发布形式,需要用户自己编译成可执行的二进制代码bin并进行安装,其优点是配置灵活,可以随意去掉或保留某些功能/模块,适应多种硬件/操作系统平台及编译环境,缺点是难度较大,一般不适合初学者使用。
怎么知道一个tar.gz/bz2包是二进制文件包呢还是源代码包?要分辨它到底是什么最好的办法就是查看包里的文件清单,使用命令tar ztvf *.tar.gz解压缩及解包后,进入新生成的目录下。
源代码包里的文件往往会含有种种源代码文件,头文件*.h、c代码源文件*.c、C++代码源文件*.cc/*.cpp等;而二进制包里的文件则会有可执行文件(与软件同名的往往是主执行文件),标志是其所在路径含有名为bin的目录(仅有少数例外)。
如果是src.tar可在解包后,在新生成的目录下编译,方法前面已介绍过了,现在讲一讲src.rpm的安装和协载:
安装:rpm -rebuild xv.src.rpm
cd /usr/src/redhat/RPMS/
rpm -ivh *.rpm
卸载:rpm -e xv
说明:rpm --rebuild *.src.rpm命令将源代码编译并/usr/src/redhat/RPMS下生成二进制的rpm包,然后再安装该二进制包即可。
三、文件权限更改
chmod ------入门的一些常识
http://www.chinaunix.net 作者:wangbin 发表于:2003-09-13 23:49:13

指令名称 : chmod
使用权限 : 所有使用者

使用方式 : chmod [-cfvR] [--help] [--version] mode file...

说明 : Linux/Unix 的档案存取权限分为三级 : 档案拥有者、群组、其他。利用 chmod 可以藉以控制档案如何被他人所存取。

把计 :

mode : 权限设定字串,格式如下 : [ugoa...][[+-=][rwxX]...][,...],其中u 表示该档案的拥有者,g 表示与该档案的拥有者属于同一个群体(group)者,o 表示其他以外的人,a 表示这三者皆是。
+ 表示增加权限、- 表示取消权限、= 表示唯一设定权限。
r 表示可读取,w 表示可写入,x 表示可执行,X 表示只有当该档案是个子目录或者该档案已经被设定过为可执行。
-c : 若该档案权限确实已经更改,才显示其更改动作
-f : 若该档案权限无法被更改也不要显示错误讯息
-v : 显示权限变更的详细资料
-R : 对目前目录下的所有档案与子目录进行相同的权限变更(即以递回的方式逐个变更)
--help : 显示辅助说明
--version : 显示版本

范例 :将档案 file1.txt 设为所有人皆可读取 :
chmod ugo+r file1.txt

将档案 file1.txt 设为所有人皆可读取 :
chmod a+r file1.txt

将档案 file1.txt 与 file2.txt 设为该档案拥有者,与其所属同一个群体者可写入,但其他以外的人则不可写入 :
chmod ug+w,o-w file1.txt file2.txt

将 ex1.py 设定为只有该档案拥有者可以执行 :
chmod u+x ex1.py

将目前目录下的所有档案与子目录皆设为任何人可读取 :
chmod -R a+r *

此外chmod也可以用数字来表示权限如 chmod 777 file
语法为:chmod abc file

其中a,b,c各为一个数字,分别表示User、Group、及Other的权限。

r=4,w=2,x=1
若要rwx属性则4+2+1=7;
若要rw-属性则4+2=6;
若要r-x属性则4+1=7。

范例:
chmod a=rwx file


chmod 777 file

效果相同
chmod ug=rwx,o=x file


chmod 771 file

效果相同

若用chmod 4755 filename可使此程式具有root的权限
指令名称 : chown
使用权限 : root

使用方式 : chmod [-cfhvR] [--help] [--version] user[:group] file...

说明 : Linux/Unix 是多人多工作业系统,所有的档案皆有拥有者。利用 chown 可以将档案的拥有者加以改变。一般来说,这个指令只有是由系统管理者(root)所使用,一般使用者没有权限可以改变别人的档案拥有者,也没有权限可以自 己的档案拥有者改设为别人。只有系统管理者(root)才有这样的权限。

把计 :

user : 新的档案拥有者的使用者 IDgroup : 新的档案拥有者的使用者群体(group)-c : 若该档案拥有者确实已经更改,才显示其更改动作-f : 若该档案拥有者无法被更改也不要显示错误讯息-h : 只对于连结(link)进行变更,而非该 link 真正指向的档案-v : 显示拥有者变更的详细资料-R : 对目前目录下的所有档案与子目录进行相同的拥有者变更(即以递回的方式逐个变更)--help : 显示辅助说明--version : 显示版本

范例 :
将档案 file1.txt 的拥有者设为 users 群体的使用者 jessie :
chown jessie:users file1.txt

将目前目录下的所有档案与子目录的拥有者皆设为 users 群体的使用者 lamport :
chmod -R lamport:users *
-rw------- (600) -- 只有属主有读写权限。

-rw-r--r-- (644) -- 只有属主有读写权限;而属组用户和其他用户只有读权限。

-rwx------ (700) -- 只有属主有读、写、执行权限。

-rwxr-xr-x (755) -- 属主有读、写、执行权限;而属组用户和其他用户只有读、执行权限。

-rwx--x--x (711) -- 属主有读、写、执行权限;而属组用户和其他用户只有执行权限。

-rw-rw-rw- (666) -- 所有用户都有文件读、写权限。这种做法不可取。

-rwxrwxrwx (777) -- 所有用户都有读、写、执行权限。更不可取的做法。

以下是对目录的两个普通设定:


drwx------ (700) - 只有属主可在目录中读、写。

drwxr-xr-x (755) - 所有用户可读该目录,但只有属主才能改变目录中的内容。

四、常用linux命令
1、进入纯命令行
在终端输入
#/sbin/telinit 3
2、root密码丢失解决
GRUB:在引导装载程序菜单上,键入 [e] 来进入编辑模式。
你会面对一个引导项目列表。查找其中类似以下输出 的句行:
kernel /vmlinuz-2.4.18-0.4 ro root=/dev/hda2
按箭头键直到这一行被突出显示,然后按 [e]。
你现在可在文本结尾处空一格再添加 single 来告诉 GRUB 引导单用户 Linux 模式。按 [Enter] 键来使编辑结果生效。
你会被带会编辑模式屏幕,从这里,按 , GRUB 就会引导单用户 Linux 模式。 结束载入后,你会面对一个与以下相似的 shell 提示:
sh-2.05#
现在,你便可以改变根命令,键入:
bash# passwd root
你会被要求重新键入口令来校验。结束后, 口令就会被改变,你便可以在提示下键入 reboot 来重新引导;然后,象平常一样登录为根用户。
LILO:当系统启动到出现LILO引导画面时,对于图形引导方式按TAB键进入文本方式,然后在LILO处
输入linux single回车即可进入免密码的控制台,进入以后使用passwd命令修改root的密码
即可。

五、mysql数据库操作
连接数据库服务器 ./mysql -h host_name -u user_name -p
* -h host_name(--host=host_name),连接的数据库主机名,如果在本地主机上则可省略。
*-u user_name(--user=user_name),数据库用户名,在unix系统上,如果系统的登录名与数据用户名一样,则可省略。在windows系统中,可通过设置环境变量USER来给出数据库用户名,如set USER=username。
* -p(--password),提供数据库用户密码,有该选项mysql就会提示你输入密码。输入的密码以星号显示,以确保安全。也可直接在-p后写上密码(-p和密码间不能有空格),但这不安全,不推荐。
连接成功后,mysql数据库服务器会显示一些欢迎信息。接着就可用mysql>use database_name命令打开指定的数据库。grant all on egroupware.* to root@localhost identified by 'oletolet';
服务器的启动和关闭
在Linux和windows平台下MySQL服务器的启动方式有很大不同,这里将分开介绍:
* Linux平台:Linux平台下,每一个进程都需由一个用户来运行,MySQL最好不要以root用户来运行。我们可创建一个mysql用户和 mysql组,MySQL服务器程序目录和数据目录由这个用户和组所拥有,其它用户没有任何权限。以mysql用户来运行MySQL服务器。% mysqld --user=mysql
#即使以root用户执行该命令,MySQL数据库还是会与mysql用户ID关联。 为了使服务器在系统启动时自动以mysql用户运行,需配置my.cnf配置文件 ,把user=mysql包含在[mysqld]段中。
关闭服务器可用% mysql.server stop或% mysqladmin -u root -p shutdown
* windows平台:手动方式:直接运行c:\mysqld命令。
作为服务方式:运行c:\mysqld-nt --install命令,把mysqld-nt安装为windows的服务,此后,每当windows启动时,它就会自动运行。mysqld-nt是一个支持命名管道的MySQL服务器。
运行c:\mysqld-nt --remove可把服务删除。
手动启动关闭服务的方法是运行c:\net start mysql和c:\net stop mysql命令。

windows平台下:

用管理员帐号登录服务器,关闭MySQL数据库服务器。

使用--skip-grant-tables参数启动服务器:

c:\mysql\bin>mysqld-nt --skip-grant-tables

重新打开一个console窗口,用mysql命令登录服务器设置root的新密码:

c:\mysql\bin>mysql
mysql> use mysql
mysql> set password for 'root'@'localhost' = password('password');


卸载rpm
查看是否安装
rpm -qa | grep 包名
卸载 rpm –e 包名

加载光盘mount -t iso9660 /dev/hdc /mnt/cdrom

Posted on September 18, 2006 10:44 AM | | Comments (0) | TrackBacks (0)

好几天前提到了准备转成wordpress的程序,看中了wordpress的可定制性强、功能多,还有一点是它可以实现链接地址的优化,有利于搜索引擎的收录,这段时间一直在研究wordpress,迟迟没有转过去一是考虑先前数据的转移、二是发现那个Apache服务器没有支持mod_rewrite模块不能实现永久链接的更改(有个办法是在地址前加上/index.php/),找了不少资料都介绍的很简单,最后还是alone找到了详尽的资料和解决办法,目前技术上的问题已经解决了,我决定开始一步步把现在PJBlog上的内容转过去了。

关于Apache mod_rewrite模块的资料如下:

Apache的mod_rewrite是提供了强大URL操作的杀手级的模块,可以实现几乎所有你梦想的URL操作类型,其代价是你必须接受其复杂性,因为mod_rewrite的主要障碍就是初学者不容易理解和运用,即使是Apache专家有时也会发掘出mod_rewrite的新用途。

换句话说:对mod_rewrite,或者是打退堂鼓永不再用,或者是喜欢它并一生受用。

ReWrite可以应用在以下方面或者解决以下问题:
URL的规划
规范的URL
说明:
在有些网站服务器上,一个资源会拥有多个URL,在实际应用和发布中应该被使用的是规范的URL,其他的则是简写或者是内部使用的。无论用户在请求中使用什么形式的URL,他最终看见的都应该是规范的URL。

方案:
对所有的不规范的URL执行一个外部的HTTP重定向,以改变它在浏览器地址栏中的显示及其后继的请求。下例中的规则集用规范的/u/user替换/~user,并修正了/u/user所遗漏的后缀的斜杠。

代码:
RewriteRule ^/~([^/]+)/?(.*) /u/$1/$2 [R]
RewriteRule ^/([uge])/([^/]+)$ /$1/$2/ [R]

规范的主机名
说明:

方案:
代码:
RewriteCond %{HTTP_HOST} !^fully.qualified.domain.name [NC]
RewriteCond %{HTTP_HOST} !^$
RewriteCond %{SERVER_PORT} !^80$
RewriteRule ^/(.*) http://fully.qualified.domain.name:%{SERVER_PORT}/$1 [L,R]
RewriteCond %{HTTP_HOST} !^fully.qualified.domain.name [NC]
RewriteCond %{HTTP_HOST} !^$
RewriteRule ^/(.*) http://fully.qualified.domain.name/$1 [L,R]
被移动过的DocumentRoot
说明:
通常,网站服务器的DocumentRoot直接对应于URL”/”,但是,它常常不是处于最高一级,而可能只是众多数据池中的一个实体。比如,在Intranet站点中,有/e/www/(WWW的主页)、/e/sww/ (Intranet的主页)等等,而DocumentRoot指向了/e/www/,则必须保证此数据池中的所有内嵌的图片和其他元素对后继请求有效。

方案:
只须重定向URL /到/e/www/即可。这个方案看起来很简单,但只是有了mod_rewrite模块的支持,它才简单,因为传统的URL Aliases机制(由mod_alias及其相关模块提供)只是作了一个前缀匹配,DocumentRoot是一个对所有URL的前缀,因而无法实现这样的重定向。而用mod_rewrite的确很简单:

代码:
RewriteEngine on
RewriteRule ^/$ /e/www/ [R]
后缀斜杠的问题
说明:
每个网管对引用目录后缀斜杠的问题都有一本苦经,如果遗漏了,服务器会产生一个错误,因为如果请求是/~quux/foo而不是/~quux/foo/,服务器会去找一个叫foo的文件,而它是一个目录,所以就报错了。事实上,大多数情况下,它自己会试图修正这个错误,但是有时候需要你手工纠正,比如,在重写了许多CGI脚本中的复杂的URL以后。

方案:
解决这个微妙问题的方案是让服务器自动添加后缀的斜杠。对此,必须使用一个外部的重定向,使浏览器正确地处理后继的对诸如图片的请求。如果仅仅作一个内部的重写,可能只对目录页面有效,而对内嵌有使用相对URL的图片的页面则无效,因为浏览器有请求内嵌目标的可能。比如,如果不用外部重定向,/~quux/foo/index.html页面中对image.gif的请求,其结果将是/~quux/image.gif!。

所以,应该这样写:

代码:
RewriteEngine on
RewriteBase /~quux/
RewriteRule ^foo$ foo/ [R]

又懒又疯狂的做法是把这些写入其宿主目录中的顶级.htaccess中,但是须注意,如此会带来一些处理上的开销。

代码:
RewriteEngine on
RewriteBase /~quux/
RewriteCond %{REQUEST_FILENAME} -d
RewriteRule ^(.+[^/])$ $1/ [R]
集群网站的同类URL规划
说明:
我们希望在一个Intranet集群网站中,对所有WWW服务器建立一个同类的一致性的URL规划,也就是,所有的URL(对单个服务器来说,是本地的依赖于此服务器的!)是独立于服务器的!我们需要的是一个具有独立于服务器的一致性规划的WWW名称空间,即,URL不需要包含正确的物理的目标服务器,而由集群本身来自动定位物理的目标主机。

方案:
首先,目标服务器的信息来自(产生)于包含有用户、组以及实体的外部地图,其格式形如:

代码:
user1 server_of_user1
user2 server_of_user2
: :
这些信息被存入map.xxx-to-host文件。其次,如果URL在一个服务器上无效,需要引导所有的服务器重定向URL

代码:
/u/user/anypath
/g/group/anypath
/e/entity/anypath



代码:
http://physical-host/u/user/anypath
http://physical-host/g/group/anypath
http://physical-host/e/entity/anypath
以下规则集依靠地图文件来完成这个操作(假定,如果一个用户在地图中没有对应的项,则使用server0为默认服务器):

代码:
RewriteEngine on

RewriteMap user-to-host txt:/path/to/map.user-to-host
RewriteMap group-to-host txt:/path/to/map.group-to-host
RewriteMap entity-to-host txt:/path/to/map.entity-to-host

RewriteRule ^/u/([^/]+)/?(.*) http://${user-to-host:$1|server0}/u/$1/$2
RewriteRule ^/g/([^/]+)/?(.*) http://${group-to-host:$1|server0}/g/$1/$2
RewriteRule ^/e/([^/]+)/?(.*) http://${entity-to-host:$1|server0}/e/$1/$2

RewriteRule ^/([uge])/([^/]+)/?$ /$1/$2/.www/
RewriteRule ^/([uge])/([^/]+)/([^.]+.+) /$1/$2/.www/$3
移动宿主目录到不同的网站服务器
说明:
通常,许多网管在建立一个新的网站服务器时,都会有这样的要求:重定向一个网站服务器上的所有宿主目录到另一个网站服务器。

方案:
很简单,用mod_rewrite。在老的网站服务器上重定向所有的URL /~user/anypath到http://newserver/~user/anypath。

代码:
RewriteEngine on
RewriteRule ^/~(.+) http://newserver/~$1 [R,L]
结构化的宿主目录
说明:
一些拥有几千个用户的网站通常都使用结构化的宿主目录规划,即,每个宿主目录位于一个带有特定前缀比如其用户名的第一个字符的子目录下。那么,/~foo/anypath代表/home/f/foo/.www/anypath,而/~bar/anypath代表/home/b/bar/.www/anypath。

方案:
可以使用下列规则集来扩展~以达到上述目的。

代码:
RewriteEngine on
RewriteRule ^/~(([a-z])[a-z0-9]+)(.*) /home/$2/$1/.www$3
文件系统的重组
说明:
这是一个不加雕琢的例子:一个大量使用针对目录的规则集以实现平滑观感,而从来不用调整数据结构的杀手级的应用。背景:net.sw从1992年开始,存放了我收集的免费的有效的Unix软件包。它是我的爱好也是我的工作,因为在学习计算机科学的同时,业余时间还做了多年的系统和网络的管理员。每周我都需要整理软件,因而建立了一个层次很深的目录结构来存放各种软件包:

代码:
drwxrwxr-x 2 netsw users 512 Aug 3 18:39 Audio/
drwxrwxr-x 2 netsw users 512 Jul 9 14:37 Benchmark/
drwxrwxr-x 12 netsw users 512 Jul 9 00:34 Crypto/
drwxrwxr-x 5 netsw users 512 Jul 9 00:41 Database/
drwxrwxr-x 4 netsw users 512 Jul 30 19:25 Dicts/
drwxrwxr-x 10 netsw users 512 Jul 9 01:54 Graphic/
drwxrwxr-x 5 netsw users 512 Jul 9 01:58 Hackers/
drwxrwxr-x 8 netsw users 512 Jul 9 03:19 InfoSys/
drwxrwxr-x 3 netsw users 512 Jul 9 03:21 Math/
drwxrwxr-x 3 netsw users 512 Jul 9 03:24 Misc/
drwxrwxr-x 9 netsw users 512 Aug 1 16:33 Network/
drwxrwxr-x 2 netsw users 512 Jul 9 05:53 Office/
drwxrwxr-x 7 netsw users 512 Jul 9 09:24 SoftEng/
drwxrwxr-x 7 netsw users 512 Jul 9 12:17 System/
drwxrwxr-x 12 netsw users 512 Aug 3 20:15 Typesetting/
drwxrwxr-x 10 netsw users 512 Jul 9 14:08 X11/

1996年7月,我决定通过一个漂亮的Web接口公开我的收藏。“漂亮”是指提供一个接口以直接浏览整个目录结构,同时不对这个结构做任何改变 - 甚至也不在结构顶部放置CGI脚本。为什么呢?因为这个结构还要能够被FTP访问,而且我不希望其中有任何Web或者CGI的成分。

方案:
这个方案分为两个部分:第一个部分,是用于在空闲时间建立所有目录页面的CGI脚本集。我把它们放在/e/netsw/.www/,如下:

代码:
-rw-r–r– 1 netsw users 1318 Aug 1 18:10 .wwwacl
drwxr-xr-x 18 netsw users 512 Aug 5 15:51 DATA/
-rw-rw-rw- 1 netsw users 372982 Aug 5 16:35 LOGFILE
-rw-r–r– 1 netsw users 659 Aug 4 09:27 TODO
-rw-r–r– 1 netsw users 5697 Aug 1 18:01 netsw-about.html
-rwxr-xr-x 1 netsw users 579 Aug 2 10:33 netsw-access.pl
-rwxr-xr-x 1 netsw users 1532 Aug 1 17:35 netsw-changes.cgi
-rwxr-xr-x 1 netsw users 2866 Aug 5 14:49 netsw-home.cgi
drwxr-xr-x 2 netsw users 512 Jul 8 23:47 netsw-img/
-rwxr-xr-x 1 netsw users 24050 Aug 5 15:49 netsw-lsdir.cgi
-rwxr-xr-x 1 netsw users 1589 Aug 3 18:43 netsw-search.cgi
-rwxr-xr-x 1 netsw users 1885 Aug 1 17:41 netsw-tree.cgi
-rw-r–r– 1 netsw users 234 Jul 30 16:35 netsw-unlimit.lst
其中的DATA/子目录包含了上述目录结构,即实在的net.sw,由rdist在需要的时候自动更新。第二个部分的遗留问题是:如何连接这两个结构为一个平滑观感的URL树?我希望在运行适当的CGI脚本而使用各种URL的时候,使用户感觉不到DATA/目录的存在。方案如下:首先,我把下列配置放在服务器上DocumentRoot中的针对目录的配置文件里,以重写公布的URL /net.sw/ 为内部路径 /e/netsw:

代码:
RewriteRule ^net.sw$ net.sw/ [R]
RewriteRule ^net.sw/(.*)$ e/netsw/$1
第一条规则是针对遗漏后缀斜杠的请求的!第二条规则才是真正实现功能的。接着,就是放在针对目录的配置文件/e/netsw/.www/.wwwacl中的杀手级的配置了:

代码:
Options ExecCGI FollowSymLinks Includes MultiViews

RewriteEngine on

# we are reached via /net.sw/ prefix
RewriteBase /net.sw/

# first we rewrite the root dir to
# the handling cgi script
RewriteRule ^$ netsw-home.cgi [L]
RewriteRule ^index.html$ netsw-home.cgi [L]

# strip out the subdirs when
# the browser requests us from perdir pages
RewriteRule ^.+/(netsw-[^/]+/.+)$ $1 [L]

# and now break the rewriting for local files
RewriteRule ^netsw-home.cgi.* - [L]
RewriteRule ^netsw-changes.cgi.* - [L]
RewriteRule ^netsw-search.cgi.* - [L]
RewriteRule ^netsw-tree.cgi$ - [L]
RewriteRule ^netsw-about.html$ - [L]
RewriteRule ^netsw-img/.*$ - [L]

# anything else is a subdir which gets handled
# by another cgi script
RewriteRule !^netsw-lsdir.cgi.* - [C]
RewriteRule (.*) netsw-lsdir.cgi/$1
阅读提示:

注意前半部分中的标志L(最后),和无对应项(’-')
注意后半部分中的符号!(非),和标志C (链)
注意最后一条规则的全匹配模式
代码:
NCSA imagemap和Apache mod_imap
说明:
许多人都希望在从NCSA网站服务器向较现代的Apache网站服务器转移中实现平滑过渡,即希望老的NCSA imagemap程序能在Apache的较现代的mod_imap支持下正常运作。但问题在于,到处都是通过/cgi-bin/imagemap/path/to/page.map引用imagemap程序的连接,而在Apache下,应该写成/path/to/page.map。

方案:
使用全局规则在空闲时间去除所有这些请求的前缀:

代码:
RewriteEngine on
RewriteRule ^/cgi-bin/imagemap(.*) $1 [PT]
在多个目录中搜索页面
说明:
有时会有必要使网站服务器在多个目录中搜索页面,对此,MultiViews或者其他技术无能为力。

方案:
编制一个明确的规则集以搜索目录中的文件。

代码:
RewriteEngine on

# first try to find it in custom/…
# …and if found stop and be happy:
RewriteCond /your/docroot/dir1/%{REQUEST_FILENAME} -f
RewriteRule ^(.+) /your/docroot/dir1/$1 [L]

# second try to find it in pub/…
# …and if found stop and be happy:
RewriteCond /your/docroot/dir2/%{REQUEST_FILENAME} -f
RewriteRule ^(.+) /your/docroot/dir2/$1 [L]

# else go on for other Alias or ScriptAlias directives,
# etc.
RewriteRule ^(.+) - [PT]
按照URL的片段设置环境变量
说明:
如果希望保持请求之间的状态信息,但又不希望使用CGI来包装所有页面,而只通过分离URL中的有用信息来编码。

方案:
可以用一个规则集来分离出状态信息,并设置环境变量以备此后用于XSSI或CGI。如此,一个/foo/S=java/bar/的URL会被解析为/foo/bar/,而环境变量STATUS则被设置为”java”。

代码:
RewriteEngine on
RewriteRule ^(.*)/S=([^/]+)/(.*) $1/$3 [E=STATUS:$2]
虚拟用户主机
说明:
如果需要为用户username支持一个www.username.host.domain.com的主页,但不是用在此机器上建虚拟主机的方法,而是用仅在此机器上增加一个DNS记录的方法实现。

方案:
对HTTP/1.0的请求,这是无法实现的;但是对HTTP/1.1的在HTTP头中包含有主机名的请求,可以用以下规则集来内部地重写http://www.username.host.com/anypath为/home/username/anypath:

代码:
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www.[^.]+.host.com$
RewriteRule ^(.+) %{HTTP_HOST}$1 [C]
RewriteRule ^www.([^.]+).host.com(.*) /home/$1$2
为外来访问者重定向宿主目录
说明:
对不是来自本地域ourdomain.com的外来访问者的请求,重定向其宿主目录URL到另一个网站服务器www.somewhere.com,有时这种做法也会用在虚拟主机的上下文中。

方案:
只须一个重写条件:

代码:
RewriteEngine on
RewriteCond %{REMOTE_HOST} !^.+.ourdomain.com$
RewriteRule ^(/~.+) http://www.somewhere.com/$1 [R,L]
重定向失败的URL到其他网站服务器
说明:
如何重写URL以重定向对网站服务器A的失败请求到服务器B,是一个常见的问题。一般,可以用Perl写的CGI脚本通过ErrorDocument来解决,此外,还有mod_rewrite方案。但是须注意,这种方法的执行效率不如用ErrorDocument的CGI脚本!

方案:
第一种方案,有最好的性能而灵活性欠佳,出错概率小所以安全:

代码:
RewriteEngine on
RewriteCond /your/docroot/%{REQUEST_FILENAME} !-f
RewriteRule ^(.+) http://webserverB.dom/$1
但是其问题在于,它只对位于DocumentRoot中的页面有效。虽然可以增加更多的条件(比如同时还处理宿主目录,等等),但是还有一个更好的方法:

代码:
RewriteEngine on
RewriteCond %{REQUEST_URI} !-U
RewriteRule ^(.+) http://webserverB.dom/$1
这种方法使用了mod_rewrite提供的“向前参照(look-ahead)”的功能,是一种对所有URL类型都有效而且安全的方法。但是,对网站服务器的性能会有影响,所以如果网站服务器有一个强大的CPU,那就用这个方法。而在慢速机器上,可以用第一种方法,或者用性能更好的ErrorDocument CGI脚本。

扩展的重定向
说明:
有时候,我们会需要更多的对重定向URL的(有关字符转义机制方面的)控制。通常,Apache内核中的URL转义函数uri_escape()同时还会对anchor转义,即,类似”url#anchor”的URL,因此,你不能用mod_rewrite对此类URL直接重定向。那么如何实现呢?

方案:
必须用NPH-CGI脚本使它自己重定向,因为对NPH(non-parseable headers [无须解析的HTTP头])不会发生转义操作。首先,在针对服务器的配置中(应该位于所有重写规则的最后),引入一种新的URL类型xredirect::

代码:
RewriteRule ^xredirect:(.+) /path/to/nph-xredirect.cgi/$1
[T=application/x-httpd-cgi,L]
以强制所有带xredirect:前缀的URL被传送到如下的nph-xredirect.cgi程序:

代码:
#!/path/to/perl
##
## nph-xredirect.cgi — NPH/CGI script for extended redirects
## Copyright (c) 1997 Ralf S. Engelschall, All Rights Reserved.
##

$| = 1;
$url = $ENV{’PATH_INFO’};

print “HTTP/1.0 302 Moved Temporarilyn”;
print “Server: $ENV{’SERVER_SOFTWARE’}n”;
print “Location: $urln”;
print “Content-type: text/htmln”;
print “n”;
print “n”;
print “n”;
print “n”;
print “n”;
print “n”;
print ”

Moved Temporarily (EXTENDED)
n”;
print “The document has moved here.n”;
print “n”;
print “n”;

##EOF##
这是一种可以重定向所有URL类型的方法,包括不被mod_rewrite直接支持的类型。所以,还可以这样重定向news:newsgroup:

代码:
RewriteRule ^anyurl xredirect:news:newsgroup
注意:无须对上述规则加[R]或[R,L],因为xredirect:会在稍后被其特殊的传送规则扩展。
文档访问的多路复用
说明:
你知道http://www.perl.com/CPAN的CPAN(Comprehensive Perl Archive Network)吗?它实现了一个重定向以提供,全世界的CPAN镜像中离访问者最近的一个FTP站点,也可以称之为FTP访问多路复用服务。CPAN是通过CGI脚本实现的,那么用mod_rewrite如何实现呢?

方案:
首先,我们注意到mod_rewrite从3.0.0版本开始,还可以重写”ftp:”类型。其次,对客户端顶级域名的路径最近的求取可以用RewriteMap实现。利用链式规则集,并用顶级域名作为查找多路复用地图的键,可以这样做:

代码:
RewriteEngine on
RewriteMap multiplex txt:/path/to/map.cxan
RewriteRule ^/CxAN/(.*) %{REMOTE_HOST}::$1 [C]
RewriteRule ^.+.([a-zA-Z]+)::(.*)$ ${multiplex:$1|ftp.default.dom}$2 [R,L]

##
## map.cxan — Multiplexing Map for CxAN
##

de ftp://ftp.cxan.de/CxAN/
uk ftp://ftp.cxan.uk/CxAN/
com ftp://ftp.cxan.com/CxAN/
:
##EOF##

依赖于时间的重写
说明:
在页面内容依时间不同而变化的场合,比如重定向特定页面,许多网管仍然采用CGI脚本的方法,如何用mod_rewrite来实现呢?

方案:
有许多类似TIME_xxx的变量可以用在重写条件中,利用STRING和=STRING的类型比较,并加以连接,就可以实现依赖于时间的重写:

代码:
RewriteEngine on
RewriteCond %{TIME_HOUR}%{TIME_MIN} >0700
RewriteCond %{TIME_HOUR}%{TIME_MIN} <1900
RewriteRule ^foo.html$ foo.day.html
RewriteRule ^foo.html$ foo.night.html
此例使URL foo.html在07:00-19:00时指向foo.day.html,而在其余时间,则指向foo.night.html,对主页是一个不错的功能…

对YYYY过渡为XXXX的向前兼容
说明:
在转变了大批.html文件为.phtml,使文档.YYYY过渡成为文档.XXXX后,如何保持URL的向前兼容(仍然虚拟地存在)?

方案:
只须按基准文件名重写,并测试带有新的扩展名的文件是否存在,如果存在,则用新的,否则,仍然用原来的。

代码:
# backward compatibility ruleset for
# rewriting document.html to document.phtml
# when and only when document.phtml exists
# but no longer document.html
RewriteEngine on
RewriteBase /~quux/
# parse out basename, but remember the fact
RewriteRule ^(.*).html$ $1 [C,E=WasHTML:yes]
# rewrite to document.phtml if exists
RewriteCond %{REQUEST_FILENAME}.phtml -f
RewriteRule ^(.*)$ $1.phtml [S=1]
# else reverse the previous basename cutout
RewriteCond %{ENV:WasHTML} ^yes$
RewriteRule ^(.*)$ $1.html

内容的处理
新旧URL(内部的)
说明:
假定已经把文件bar.html改名为foo.html,需要对老的URL向前兼容,即让用户仍然可以使用老的URL,而感觉不到文件被改名了。

方案:
通过以下规则内部地重写老的URL为新的:

代码:
RewriteEngine on
RewriteBase /~quux/
RewriteRule ^foo.html$ bar.html
新旧URL(外部的)
说明:
仍然假定已经把文件bar.html改名为foo.html,需要对老的URL向前兼容,但是要让用户得到文件被改名的暗示,即,其浏览器的地址栏中显示的是新的URL。

方案:
作一个HTTP的强制重定向以改变浏览器和用户界面上的显示:

代码:
RewriteEngine on
RewriteBase /~quux/
RewriteRule ^foo.html$ bar.html [R]
依赖于浏览器的内容
说明:
至少对重要的顶级页面,有时候有必要提供依赖于浏览器的最佳的内容,即对最新的Netscape提供最大化的版本,对Lynx提供最小化的版本,而对其他的浏览器则提供一个功能一般的版本。

方案:
对此,内容协商无能为力,因为浏览器不提供其那种形式的类型,所以只能在HTTP头”User-Agent”上想办法。以下规则集可以完成这个操作:如果HTTP头”User-Agent”以”Mozilla/3″开头,则页面foo.html被重写为foo.NS.html,而后重写操作终止;如果是”Lynx”或者版本号为1和2的”Mozilla”,则重写为foo.20.html;而其他所有的浏览器收到的页面则是foo.32.html:

代码:
RewriteCond %{HTTP_USER_AGENT} ^Mozilla/3.*
RewriteRule ^foo.html$ foo.NS.html [L]

RewriteCond %{HTTP_USER_AGENT} ^Lynx/.* [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mozilla/[12].*
RewriteRule ^foo.html$ foo.20.html [L]

RewriteRule ^foo.html$ foo.32.html [L]
动态镜像
说明:
假定,需要在我们的名称空间里加入其他远程主机的页面。对FTP服务器,可以用mirror程序以在本地机器上维持一个对远程数据的最新的拷贝;对网站服务器,可以用类似的用于HTTP的webcopy程序。但这两种技术都有一个主要的缺点:此本地拷贝必须通过这个程序的执行来更新。所以,比较好的方法是,不采用静态镜像,而采用动态镜像,即,在有数据请求时自动更新(远程主机上更新的数据)。

方案:
为此,使用Proxy Throughput功能(flag [P]),以映射远程页面甚至整个远程网络区域到我们的名称空间:

代码:
RewriteEngine on
RewriteBase /~quux/
RewriteRule ^hotsheet/(.*)$ http://www.tstimpreso.com/hotsheet/$1 [P]

RewriteEngine on
RewriteBase /~quux/
RewriteRule ^usa-news.html$ http://www.quux-corp.com/news/index.html [P]
反向动态镜像
说明:

方案:
代码:
RewriteEngine on
RewriteCond /mirror/of/remotesite/$1 -U
RewriteRule ^http://www.remotesite.com/(.*)$ /mirror/of/remotesite/$1
通过Intranet取得丢失的数据
说明:
这是一种在受防火墙保护的(内部的)Intranet(www2.quux-corp.dom)上保存和维护实际数据,而虚拟地运行企业级(外部的)Internet网站服务器(www.quux-corp.dom)的巧妙的方法。这种方法是外部服务器在空闲时间从内部服务器取得被请求的数据。

方案:
首先,必须确保防火墙对内部服务器的保护,并只允许此外部服务器取得数据。对包过滤(packet-filtering)防火墙,可以如下制定防火墙规则:

代码:
ALLOW Host www.quux-corp.dom Port >1024 –> Host www2.quux-corp.dom Port 80
DENY Host * Port * –> Host www2.quux-corp.dom Port 80
按你的实际配置,只要对上例稍作调整即可。接着,建立通过代理后台获取丢失数据的mod_rewrite规则:

代码:
RewriteRule ^/~([^/]+)/?(.*) /home/$1/.www/$2
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^/home/([^/]+)/.www/?(.*) http://www2.quux-corp.dom/~$1/pub/$2 [P]
负载的均衡
说明:
如何均衡www.foo.com的负载到www[0-5].foo.com(一共是6个服务器)?

方案:
这个问题有许多可能的解决方案,在此,我们讨论通称为“基于DNS(DNS-based)的”方案,和特殊的使用mod_rewrite的方案:

DNS循环(DNS Round-Robin)
最简单的方法是用BIND的DNS循环特性,只要按惯例设置www[0-9].foo.com的DNS的A(地址)记录,如:

代码:
www0 IN A 1.2.3.1
www1 IN A 1.2.3.2
www2 IN A 1.2.3.3
www3 IN A 1.2.3.4
www4 IN A 1.2.3.5
www5 IN A 1.2.3.6
然后,增加以下各项:

代码:
www IN CNAME www0.foo.com.
IN CNAME www1.foo.com.
IN CNAME www2.foo.com.
IN CNAME www3.foo.com.
IN CNAME www4.foo.com.
IN CNAME www5.foo.com.
IN CNAME www6.foo.com.
注意,上述看起来似乎是错误的,但事实上,它的确是BIND中的一个预期的特性,而且也可以这样用。无论如何,现在www.foo.com已经被解析,BIND可以给出www0-www6 - 虽然每次在次序上会有轻微的置换/循环,客户端的请求可以被分散到各个服务器。可是,这并不是一个优秀的负载均衡方案,因为,DNS解析信息可以被网络中其他名称服务器缓冲,而一旦www.foo.com被解析为wwwN.foo.com,则其后继请求都将被送往www.foo.com。但是最终结果是正确的,因为请求的总量的确被分散到各个服务器了

DNS 负载均衡
一种成熟的基于DNS的负载均衡方法是使用http://www.stanford.edu/~schemers/ docs/lbnamed/lbnamed.html的lbnamed程序,它是一个Perl 5程序,带有若干辅助工具,实现了真正的基于DNS的负载均衡。

代理吞吐循环(Proxy Throughput Round-Robin)
这是一个使用mod_rewrite及其代理吞吐特性的方法。首先,在DNS记录中,将www0.foo.com固定为www.foo.com,如下:

代码:
www IN CNAME www0.foo.com.
其次,将www0.foo.com转换为一个专职代理服务器,即,由这个机器把所有到来的URL通过内部代理分散到另外5个服务器(www1-www5)。为此,必须建立一个规则集,对所有URL调用一个负载均衡脚本lb.pl。

代码:
RewriteEngine on
RewriteMap lb prg:/path/to/lb.pl
RewriteRule ^/(.+)$ ${lb:$1} [P,L]
以下是lb.pl:

代码:
#!/path/to/perl
##
## lb.pl — load balancing script
##

$| = 1;

$name = “www”; # the hostname base
$first = 1; # the first server (not 0 here, because 0 is myself)
$last = 5; # the last server in the round-robin
$domain = “foo.dom”; # the domainname

$cnt = 0;
while () {
$cnt = (($cnt+1) % ($last+1-$first));
$server = sprintf(”%s%d.%s”, $name, $cnt+$first, $domain);
print “http://$server/$_”;
}

##EOF##

最后的说明:这样有用吗?www0.foo.com似乎也会超载呀?答案是:没错,它的确会超载,但是它超载的仅仅是简单的代理吞吐请求!所有诸如SSI、CGI、ePerl等等的处理完全是由其他机器完成的,这个才是要点。
硬件/TCP循环
还有一个硬件解决方案。Cisco有一个叫LocalDirector的东西,实现了TCP/IP层的负载均衡,事实上,它是一个位于网站集群前端的电路级网关。如果你有足够资金而且的确需要高性能的解决方案,那么可以用这个。

反向代理
说明:

方案:
代码:
##
## apache-rproxy.conf — Apache configuration for Reverse Proxy Usage
##

# server type
ServerType standalone
Listen 8000
MinSpareServers 16
StartServers 16
MaxSpareServers 16
MaxClients 16
MaxRequestsPerChild 100

# server operation parameters
KeepAlive on
MaxKeepAliveRequests 100
KeepAliveTimeout 15
Timeout 400
IdentityCheck off
HostnameLookups off

# paths to runtime files
PidFile /path/to/apache-rproxy.pid
LockFile /path/to/apache-rproxy.lock
ErrorLog /path/to/apache-rproxy.elog
CustomLog /path/to/apache-rproxy.dlog “%{%v/%T}t %h -> %{SERVER}e URL: %U”

# unused paths
ServerRoot /tmp
DocumentRoot /tmp
CacheRoot /tmp
RewriteLog /dev/null
TransferLog /dev/null
TypesConfig /dev/null
AccessConfig /dev/null
ResourceConfig /dev/null

# speed up and secure processing

Options -FollowSymLinks -SymLinksIfOwnerMatch
AllowOverride None


# the status page for monitoring the reverse proxy

SetHandler server-status


# enable the URL rewriting engine
RewriteEngine on
RewriteLogLevel 0

# define a rewriting map with value-lists where
# mod_rewrite randomly chooses a particular value
RewriteMap server rnd:/path/to/apache-rproxy.conf-servers

# make sure the status page is handled locally
# and make sure no one uses our proxy except ourself
RewriteRule ^/apache-rproxy-status.* - [L]
RewriteRule ^(http|ftp)://.* - [F]

# now choose the possible servers for particular URL types
RewriteRule ^/(.*.(cgi|shtml))$ to://${server:dynamic}/$1 [S=1]
RewriteRule ^/(.*)$ to://${server:static}/$1

# and delegate the generated URL by passing it
# through the proxy module
RewriteRule ^to://([^/]+)/(.*) http://$1/$2 [E=SERVER:$1,P,L]

# and make really sure all other stuff is forbidden
# when it should survive the above rules…
RewriteRule .* - [F]

# enable the Proxy module without caching
ProxyRequests on
NoCache *

# setup URL reverse mapping for redirect reponses
ProxyPassReverse / http://www1.foo.dom/
ProxyPassReverse / http://www2.foo.dom/
ProxyPassReverse / http://www3.foo.dom/
ProxyPassReverse / http://www4.foo.dom/
ProxyPassReverse / http://www5.foo.dom/
ProxyPassReverse / http://www6.foo.dom/

##
## apache-rproxy.conf-servers — Apache/mod_rewrite selection table
##

# list of backend servers which serve static
# pages (HTML files and Images, etc.)
static www1.foo.dom|www2.foo.dom|www3.foo.dom|www4.foo.dom

# list of backend servers which serve dynamically
# generated page (CGI programs or mod_perl scripts)
dynamic www5.foo.dom|www6.foo.dom
新的MIME类型,新的服务
说明:
网上有许多很技巧的CGI程序,但是用法晦涩,许多网管弃之不用。即使是Apache的MEME类型的动作处理器,也仅仅在CGI程序不需要在其输入中包含特殊URL(PATH_INFO和QUERY_STRINGS)时才很好用。首先,配置一种新的后缀为.scgi(for secure CGI)文件类型,其处理器是很常见的cgiwrap程序。问题是:如果使用同类URL规划(见上述),而用户宿主目录中的一个文件的URL是/u/user/foo/bar.scgi,可是cgiwrap要求的URL的格式是/~user/foo/bar.scgi/,以下规则解决了这个问题:

代码:
RewriteRule ^/[uge]/([^/]+)/.www/(.+).scgi(.*) …
… /internal/cgi/user/cgiwrap/~$1/$2.scgi$3 [NS,T=application/x-http-cgi]
另外,假设需要使用其他程序:wwwlog(显示access.log中的一个URL子树)和wwwidx(对一个URL子树运行Glimpse),则必须对这些程序提供URL区域作为其操作对象。比如,对/u/user/foo/执行swwidx程序的超链是这样的:

代码:
/internal/cgi/user/swwidx?i=/u/user/foo/
其缺点是,必须同时硬编码超链中的区域和CGI的路径,如果重组了这个区域,就需要花费大量时间来修改各个超链。

方案:
方案是用一个特殊的新的URL格式,自动拼装CGI参数:

代码:
RewriteRule ^/([uge])/([^/]+)(/?.*)/* /internal/cgi/user/wwwidx?i=/$1/$2$3/
RewriteRule ^/([uge])/([^/]+)(/?.*):log /internal/cgi/user/wwwlog?f=/$1/$2$3
现在,这个搜索到/u/user/foo/的超链简化成了:

代码:
HREF=”*”
它会被内部地自动转换为

代码:
/internal/cgi/user/wwwidx?i=/u/user/foo/
如此,可以为使用:log的超链,拼装出调用CGI程序的参数。

从静态到动态
说明:
如何无缝转换静态页面foo.html为动态的foo.cgi,而不为浏览器/用户所察觉。

方案:
只须重写此URL为CGI-script,以强制为可以作为CGI-script运行的正确的MIME类型。如此,对/~quux/foo.html的请求其实会执行/~quux/foo.cgi。

代码:
RewriteEngine on
RewriteBase /~quux/
RewriteRule ^foo.html$ foo.cgi [T=application/x-httpd-cgi]
空闲时间内的内容协商
说明:
这是一个很难解的功能:动态生成的静态页面,即,它应该作为静态页面发送(从文件系统中读出,然后直接发出去),但是如果它丢失了,则由服务器动态生成。如此,可以静态地提供CGI生成的页面,除非有人(或者是一个cronjob)删除了这些静态页面,而且其内容可以得到更新。

方案:
以下规则集实现这个功能:
代码:
RewriteCond %{REQUEST_FILENAME} !-s
RewriteRule ^page.html$ page.cgi [T=application/x-httpd-cgi,L]
这样,如果page.html不存在或者文件大小为null,则对page.html的请求会导致page.cgi的运行。其中奥妙在于,page.cgi是一个将输出写入page.html的(同时也写入STDOUT)的常规的CGI脚本,执行完毕,服务器则将page.html的内容发出。如果网管需要强制更新其内容,只须删除page.html即可(通常由一个cronjob完成)。

自动更新的文档
说明:
建立一个复杂的页面,能够在用编辑器写了一个更新的版本时自动在浏览器上得到刷新,这不是很好吗?这可能吗?

方案:
这是可行的! 这需要综合利用MIME多成分、网站服务器的NPH和mod_rewrite的URL操控特性。首先,建立一个新的URL特性:对在文件系统中更新时需要刷新的所有URL加上:refresh。

代码:
RewriteRule ^(/[uge]/[^/]+/?.*):refresh /internal/cgi/apache/nph-refresh?f=$1
然后,修改URL

代码:
/u/foo/bar/page.html:refresh
以内部地操控此URL

代码:
/internal/cgi/apache/nph-refresh?f=/u/foo/bar/page.html
接着就是NPH-CGI脚本部分了。虽然,人们常说”left as an exercise to the reader”,我还是给出答案了。

代码:
#!/sw/bin/perl
##
## nph-refresh — NPH/CGI script for auto refreshing pages
## Copyright (c) 1997 Ralf S. Engelschall, All Rights Reserved.
##
$| = 1;

# split the QUERY_STRING variable
@pairs = split(/&/, $ENV{’QUERY_STRING’});
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$name =~ tr/A-Z/a-z/;
$name = ‘QS_’ . $name;
$value =~ s/%([a-fA-F0-9][a-fA-F0-9])/pack(”C”, hex($1))/eg;
eval “$$name = ”$value”";
}
$QS_s = 1 if ($QS_s eq ‘’);
$QS_n = 3600 if ($QS_n eq ‘’);
if ($QS_f eq ‘’) {
print “HTTP/1.0 200 OKn”;
print “Content-type: text/htmlnn”;
print “&b&ERROR&/b&: No file givenn”;
exit(0);
}
if (! -f $QS_f) {
print “HTTP/1.0 200 OKn”;
print “Content-type: text/htmlnn”;
print “&b&ERROR&/b&: File $QS_f not foundn”;
exit(0);
}

sub print_http_headers_multipart_begin {
print “HTTP/1.0 200 OKn”;
$bound = “ThisRandomString12345″;
print “Content-type: multipart/x-mixed-replace;boundary=$boundn”;
&print_http_headers_multipart_next;
}

sub print_http_headers_multipart_next {
print “n–$boundn”;
}

sub print_http_headers_multipart_end {
print “n–$bound–n”;
}

sub displayhtml {
local($buffer) = @_;
$len = length($buffer);
print “Content-type: text/htmln”;
print “Content-length: $lennn”;
print $buffer;
}

sub readfile {
local($file) = @_;
local(*FP, $size, $buffer, $bytes);
($x, $x, $x, $x, $x, $x, $x, $size) = stat($file);
$size = sprintf(”%d”, $size);
open(FP, “&$file”);
$bytes = sysread(FP, $buffer, $size);
close(FP);
return $buffer;
}

$buffer = &readfile($QS_f);
&print_http_headers_multipart_begin;
&displayhtml($buffer);

sub mystat {
local($file) = $_[0];
local($time);

($x, $x, $x, $x, $x, $x, $x, $x, $x, $mtime) = stat($file);
return $mtime;
}

$mtimeL = &mystat($QS_f);
$mtime = $mtime;
for ($n = 0; $n & $QS_n; $n++) {
while (1) {
$mtime = &mystat($QS_f);
if ($mtime ne $mtimeL) {
$mtimeL = $mtime;
sleep(2);
$buffer = &readfile($QS_f);
&print_http_headers_multipart_next;
&displayhtml($buffer);
sleep(5);
$mtimeL = &mystat($QS_f);
last;
}
sleep($QS_s);
}
}

&print_http_headers_multipart_end;

exit(0);

##EOF##


大型虚拟主机
说明:
Apache的功能很强,在有几十个虚拟主机的情况下运行得很好,但是如果你是ISP,需要提供几百个虚拟主机,那么这就不是一个最佳的选择了。

方案:
为此,需要用代理吞吐(Proxy Throughput)功能(flag [P])映射远程页面甚至整个远程网络区域到自己的名称空间:

代码:
##
## vhost.map
##
www.vhost1.dom:80 /path/to/docroot/vhost1
www.vhost2.dom:80 /path/to/docroot/vhost2
:
www.vhostN.dom:80 /path/to/docroot/vhostN

代码:
##
## httpd.conf
##
:
# use the canonical hostname on redirects, etc.
UseCanonicalName on

:
# add the virtual host in front of the CLF-format
CustomLog /path/to/access_log “%{VHOST}e %h %l %u %t ”%r” %>s %b”
:

# enable the rewriting engine in the main server
RewriteEngine on

# define two maps: one for fixing the URL and one which defines
# the available virtual hosts with their corresponding
# DocumentRoot.
RewriteMap lowercase int:tolower
RewriteMap vhost txt:/path/to/vhost.map

# Now do the actual virtual host mapping
# via a huge and complicated single rule:
#
# 1. make sure we don’t map for common locations
RewriteCond %{REQUEST_URL} !^/commonurl1/.*
RewriteCond %{REQUEST_URL} !^/commonurl2/.*
:
RewriteCond %{REQUEST_URL} !^/commonurlN/.*
#
# 2. make sure we have a Host header, because
# currently our approach only supports
# virtual hosting through this header
RewriteCond %{HTTP_HOST} !^$
#
# 3. lowercase the hostname
RewriteCond ${lowercase:%{HTTP_HOST}|NONE} ^(.+)$
#
# 4. lookup this hostname in vhost.map and
# remember it only when it is a path
# (and not “NONE” from above)
RewriteCond ${vhost:%1} ^(/.*)$
#
# 5. finally we can map the URL to its docroot location
# and remember the virtual host for logging puposes
RewriteRule ^/(.*)$ %1/$1 [E=VHOST:${lowercase:%{HTTP_HOST}}]
:
对访问的限制
阻止Robots
说明:
如何阻止一个完全匿名的robot取得特定网络区域的页面?一个/robots.txt文件可以包含若干”Robot Exclusion Protocol(robot排除协议)”的行,但不足以阻止此类robot。

方案:
可以用一个规则集以拒绝对网络区域/~quux/foo/arc/(对一个很深的目录区域进行列表可能会使服务器产生很大的负载)的访问。还必须确保仅阻止特定的robot,就是说,仅仅阻止robot访问主机是不够的,这样会同时也阻止了用户访问该主机。为此,就需要对HTTP头的User-Agent信息作匹配。

代码:
RewriteCond %{HTTP_USER_AGENT} ^NameOfBadRobot.*
RewriteCond %{REMOTE_ADDR} ^123.45.67.[8-9]$
RewriteRule ^/~quux/foo/arc/.+ - [F]
阻止内嵌的图片
说明:
假设,http://www.quux-corp.de/~quux/有一些内嵌图片的页面,这些图片很好,所以就有人用超链连到他们自己的页面中了。由于这样徒然增加了我们的服务器的流量,因此,我们不愿意这种事情发生。

方案:
虽然,我们不能100%地保护这些图片不被写入别人的页面,但至少可以对发出HTTP Referer头的浏览器加以限制。

代码:
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://www.quux-corp.de/~quux/.*$ [NC]
RewriteRule .*.gif$ - [F]

RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !.*/foo-with-gif.html$
RewriteRule ^inlined-in-foo.gif$ - [F]
对主机的拒绝
说明:
如何拒绝一批外部列表中的主机对我们服务器的使用?

方案:
代码:
For Apache >= 1.3b6:

RewriteEngine on
RewriteMap hosts-deny txt:/path/to/hosts.deny
RewriteCond ${hosts-deny:%{REMOTE_HOST}|NOT-FOUND} !=NOT-FOUND [OR]
RewriteCond ${hosts-deny:%{REMOTE_ADDR}|NOT-FOUND} !=NOT-FOUND
RewriteRule ^/.* - [F]

For Apache < = 1.3b6:

RewriteEngine on
RewriteMap hosts-deny txt:/path/to/hosts.deny
RewriteRule ^/(.*)$ ${hosts-deny:%{REMOTE_HOST}|NOT-FOUND}/$1
RewriteRule !^NOT-FOUND/.* - [F]
RewriteRule ^NOT-FOUND/(.*)$ ${hosts-deny:%{REMOTE_ADDR}|NOT-FOUND}/$1
RewriteRule !^NOT-FOUND/.* - [F]
RewriteRule ^NOT-FOUND/(.*)$ /$1

代码:
##
## hosts.deny
##
## ATTENTION! This is a map, not a list, even when we treat it as such.
## mod_rewrite parses it for key/value pairs, so at least a
## dummy value “-” must be present for each entry.
##

193.102.180.41 -
bsdti1.sdm.de -
192.76.162.40 -

对代理的拒绝
说明:
如何拒绝某个主机或者来自特定主机的用户使用Apache代理?

方案:
首先,要确保Apache网站服务器在编译时配置文件中mod_rewrite在mod_proxy的下面(!),使它在mod_proxy之前被调用。然后,如下拒绝某个主机…

代码:
RewriteCond %{REMOTE_HOST} ^badhost.mydomain.com$
RewriteRule !^http://[^/.].mydomain.com.* - [F]

…如下拒绝user@host-dependent:

代码:
RewriteCond %{REMOTE_IDENT}@%{REMOTE_HOST} ^badguy@badhost.mydomain.com$
RewriteRule !^http://[^/.].mydomain.com.* - [F]
特殊的认证
说明:
有时候,会需要一种非常特殊的认证,即,对一组明确指定的用户,允许其访问,而没有(在使用mod_access的基本认证方法时可能会出现的)任何提示。

方案:
可是使用一个重写条件列表来排除所有的朋友:

代码:
RewriteCond %{REMOTE_IDENT}@%{REMOTE_HOST} !^friend1@client1.quux-corp.com$
RewriteCond %{REMOTE_IDENT}@%{REMOTE_HOST} !^friend2@client2.quux-corp.com$
RewriteCond %{REMOTE_IDENT}@%{REMOTE_HOST} !^friend3@client3.quux-corp.com$
RewriteRule ^/~quux/only-for-friends/ - [F]
基于提交者(Referer)的反射器
说明:
如何配置一个基于HTTP头”Referer”的反射器以反射到任意数量的提交页面?

方案:
使用这个很技巧的规则集…

代码:
RewriteMap deflector txt:/path/to/deflector.map

RewriteCond %{HTTP_REFERER} !=”"
RewriteCond ${deflector:%{HTTP_REFERER}} ^-$
RewriteRule ^.* %{HTTP_REFERER} [R,L]

RewriteCond %{HTTP_REFERER} !=”"
RewriteCond ${deflector:%{HTTP_REFERER}|NOT-FOUND} !=NOT-FOUND
RewriteRule ^.* ${deflector:%{HTTP_REFERER}} [R,L]
… 并结合对应的重写地图:

代码:
##
## deflector.map
##

http://www.badguys.com/bad/index.html -
http://www.badguys.com/bad/index2.html -
http://www.badguys.com/bad/index3.html http://somewhere.com/

它可以自动将请求(在地图中指定了”-”值的时候)反射回其提交页面,或者(在地图中URL有第二个参数时)反射到一个特定的URL。
其他
外部重写引擎
说明:
一个常见的问题: 如何解决似乎无法用mod_rewrite解决的FOO/BAR/QUUX/之类的问题?

方案:
可以使用一个与RewriteMap功能相同的外部RewriteMap程序,一旦它在Apache启动时被执行,则从STDIN接收被请求的URL,并将处理过(通常是重写过的)的URL(以相同顺序!)在STDOUT输出。

代码:
RewriteEngine on
RewriteMap quux-map prg:/path/to/map.quux.pl
RewriteRule ^/~quux/(.*)$ /~quux/${quux-map:$1}
代码:
#!/path/to/perl

# disable buffered I/O which would lead
# to deadloops for the Apache server
$| = 1;

# read URLs one per line from stdin and
# generate substitution URL on stdout
while (<>) {
s|^foo/|bar/|;
print $_;
}

这是一个作演示的例子,只是把所有的URL /~quux/foo/…重写为/~quux/bar/…,而事实上,可以把它修改以获得任何你需要的功能。但是要注意,虽然一般用户都可以使用,可是只有系统管理员才可以定义这样的地图。

---------------------------

首先配置apache的httpd.conf,目的是使.htaccess文件生效


ServerAdmin a@b.com
DocumentRoot /var/www/bulknews
ServerName www.bulknews.cn


Options FollowSymLinks
AllowOverride All


ErrorLog “|/usr/local/sbin/cronolog /var/log/www/wapya/www.bulknews.cn_error_log.%Y%m%d”
CustomLog “|/usr/local/sbin/cronolog /var/log/www/wapya/www.bulknews.cn_access_log.%Y%m%d” combined


注意,这里必须是FollowSymLinks,AllowOverride是All,否则rewrite引擎根本不起作用,另外如果你的apache默认根目录是/var/www 的话,在/var/www的配置字段也要设置
Options FollowSymLinks
AllowOverride All
我的就因为这个,只是在虚拟主机设置,导致一直不能实现静态页面的转化。

2.在/var/www/bulknews下设置.htaccess文件
我们这边最简单的配置就是
RewriteEngine on
RewriteBase /
RewriteRule (.+)\.html$ show.php?id=$1 [L]
Posted on September 18, 2006 10:05 AM | | Comments (0) | TrackBacks (0)

数据来自:Linuxquestion.org论坛

cathayan整理

发行版:

  1. ubuntu 19.49%
  2. slackware 19.05%
  3. suse 13.18%
  4. debian 10.58%
  5. fedora 9.38%

窗口管理器:

  1. fluxbox 27.11%
  2. kwin 18.07%
  3. enlightenment 15.00%
  4. metacity 8.35%
  5. icewm 7.84%

桌面环境:

  1. kde 64.86%
  2. gnome 25.67%
  3. xfce 8.8%
  4. gnustep 0.57%
  5. ximian 0.10%

文本编辑器:

  1. Vim 37.96%
  2. kate 22.47%
  3. nano 9.68%
  4. emacs 8.65%
  5. gedit 7.88%

Office:

  1. openoffice.org 84.84%
  2. koffice 11.64%
  3. goffice 2.46%
  4. staroffice 1.06%
  5. applixware 0%

浏览器:

  1. firefox 71.90%
  2. konqueror 11.05%
  3. opera 10.12%
  4. mozilla 3.91%
  5. epiphany 0.88%

邮件处理:

  1. thunderbird 51.74%
  2. kmail 21.47%
  3. evolution 11.20%
  4. sylpheed 3.83%
  5. mutt 3.83%

网站开发用编辑器:

  1. quanta 44.31%
  2. Nvu 24.91%
  3. bluefish 21.53%
  4. mozilla composer 6.13%
  5. screem 2.88%

开发环境:

  1. eclipse 31.99%
  2. kdevelop 31.38%
  3. emacs 13.06%
  4. netbeans 6.11%
  5. anjuta 5.62%

文件管理器:

  1. konqueror 51.25%
  2. nautilus 15.93%
  3. midnight 11.67%
  4. krusader 7.12%
  5. roxfiler 5.73%

LiveCD:

  1. knoppix 39.59%
  2. ubuntulive 14.71%
  3. slax 13.51%
  4. dsl 9.22%
  5. simplymepis 7.00%

即时通讯:

  1. gaim 52.41%
  2. kopete 23.46%
  3. skype 7.40%
  4. amsn 5.41%
  5. xchat 3.66%
Posted on September 17, 2006 12:14 PM | | Comments (0) | TrackBacks (0)

bzip2 -d filename

Posted on September 16, 2006 4:42 PM | | Comments (0) | TrackBacks (0)
[Lorne Bailey]
by Lorne Bailey
<sherm_pbody(at)yahoo.com>

关于作者:

Lorne住在芝加哥,他是一个计算机咨询人,他的特长是把数据导入导出Oracle数据库。自从转向程序设计领域后,他一直使用*nix环境,Lorne完全避开了“DLL地狱”。他正在攻读计算机科学硕士学位。


目录:

 

GCC - 一切从这里开始

 

摘要:

要想读懂本文,你需要对C语言有基本的了解,本文将介绍如何使用gcc编译器。首先,我们介绍如何在命令行方式下使用编译器编译简单的C源代码。然后,我们简要介绍一下编译器究竟作了那些工作,以及如何控制编译过程。我们也简要介绍了调试器的使用方法。

 

GCC rules

你能想象使用封闭源代码的私有编译器编译自由软件吗?你怎么知道编译器在你的可执行文件中加入了什么?可能会加入各种后门和木马。Ken Thompson是一个著名的黑客,他编写了一个编译器,当编译器编译自己时,就在'login'程序中留下后门和永久的木马。请到 这里 阅读他对这个杰作的描述。幸运的是,我们有了gcc。当你进行 configure; make; make install 时, gcc在幕后做了很多繁重的工作。如何才能让gcc为我们工作呢?我们将开始编写一个纸牌游戏,不过我们只是为了演示编译器的功能,所以尽可能地精简了代码。我们将从头开始一步一步地做,以便理解编译过程,了解为了制作可执行文件需要做些什么,按什么顺序做。我们将看看如何编译C程序,以及如何使用编译选项让gcc按照我们的要求工作。步骤(以及所用工具)如下: 预编译 (gcc -E), 编译 (gcc), 汇编 (as),和 连接 (ld)。

 

开始...

首先,我们应该知道如何调用编译器。实际上,这很简单。我们将从那个著名的第一个C程序开始。(各位老前辈,请原谅我)。

#include <stdio.h>

int main()
{ printf("Hello World!\n");}

把这个文件保存为 game.c。 你可以在命令行下编译它:

gcc game.c

在默认情况下,C编译器将生成一个名为 a.out 的可执行文件。你可以键入如下命令运行它:

a.out
Hello World

每一次编译程序时,新的 a.out 将覆盖原来的程序。你无法知道是哪个程序创建了 a.out。我们可以通过使用 -o 编译选项,告诉 gcc我们想把可执行文件叫什么名字。我们将把这个程序叫做 game,我们可以使用任何名字,因为C没有Java那样的命名限制。

gcc -o game game.c
game
Hello World

到现在为止,我们离一个有用的程序还差得很远。如果你觉得沮丧,你可以想一想我们已经编译并运行了一个程序。因为我们将一点一点为这个程序添加功能,所以我们必须保证让它能够运行。似乎每个刚开始学编程的程序员都想一下子编一个1000行的程序,然后一次修改所有的错误。没有人,我是说没有人,能做到这个。你应该先编一个可以运行的小程序,修改它,然后再次让它运行。这可以限制你一次修改的错误数量。另外,你知道刚才做了哪些修改使程序无法运行,因此你知道应该把注意力放在哪里。这可以防止这样的情况出现:你认为你编写的东西应该能够工作,它也能通过编译,但它就是不能运行。请切记,能够通过编译的程序并不意味着它是正确的。

下一步为我们的游戏编写一个头文件。头文件把数据类型和函数声明集中到了一处。这可以保证数据结构定义的一致性,以便程序的每一部分都能以同样的方式看待一切事情。

#ifndef DECK_H
#define DECK_H

#define DECKSIZE 52

typedef struct deck_t
{
int card[DECKSIZE];
/* number of cards used */
int dealt;
}deck_t;

#endif /* DECK_H */

把这个文件保存为 deck.h。只能编译 .c 文件,所以我们必须修改 game.c。在game.c的第2行,写上 #include "deck.h"。在第5行写上 deck_t deck;。为了保证我们没有搞错,把它重新编译一次。

gcc -o game game.c

如果没有错误,就没有问题。如果编译不能通过,那么就修改它直到能通过为止。

 

预编译

编译器是怎么知道 deck_t 类型是什么的呢?因为在预编译期间,它实际上把"deck.h"文件复制到了"game.c"文件中。源代码中的预编译指示以"#"为前缀。你可以通过在gcc后加上 -E 选项来调用预编译器。

gcc -E -o game_precompile.txt game.c
wc -l game_precompile.txt
3199 game_precompile.txt

几乎有3200行的输出!其中大多数来自 stdio.h 包含文件,但是如果你查看这个文件的话,我们的声明也在那里。如果你不用 -o 选项指定输出文件名的话,它就输出到控制台。预编译过程通过完成三个主要任务给了代码很大的灵活性。

  1. 把"include"的文件拷贝到要编译的源文件中。
  2. 用实际值替代"define"的文本。
  3. 在调用宏的地方进行宏替换。

这就使你能够在整个源文件中使用符号常量(即用DECKSIZE表示一付牌中的纸牌数量),而符号常量是在一个地方定义的,如果它的值发生了变化,所有使用符号常量的地方都能自动更新。在实践中,你几乎不需要单独使用 -E 选项,而是让它把输出传送给编译器。

 

编译

作为一个中间步骤,gcc把你的代码翻译成汇编语言。它一定要这样做,它必须通过分析你的代码搞清楚你究竟想要做什么。如果你犯了语法错误,它就会告诉你,这样编译就失败了。人们有时会把这一步误解为整个过程。但是,实际上还有许多工作要gcc去做呢。

 

汇编

as 把汇编语言代码转换为目标代码。事实上目标代码并不能在CPU上运行,但它离完成已经很近了。编译器选项 -c 把 .c 文件转换为以 .o 为扩展名的目标文件。 如果我们运行

gcc -c game.c

我们就自动创建了一个名为game.o的文件。这里我们碰到了一个重要的问题。我们可以用任意一个 .c 文件创建一个目标文件。正如我们在下面所看到的,在连接步骤中我们可以把这些目标文件组合成可执行文件。让我们继续介绍我们的例子。因为我们正在编写一个纸牌游戏,我们已经把一付牌定义为 deck_t,我们将编写一个洗牌函数。这个函数接受一个指向deck类型的指针,并把一付随机的牌装入deck类型。它使用'drawn' 数组跟踪记录那些牌已经用过了。这个具有DECKSIZE个元素的数组可以防止我们重复使用一张牌。

#include <stdlib.h>
#include <stdio.h>
#include <time.h>
#include "deck.h"

static time_t seed = 0;

void shuffle(deck_t *pdeck)
{
/* Keeps track of what numbers have been used */
int drawn[DECKSIZE] = {0};
int i;

/* One time initialization of rand */
if(0 == seed)
{
seed = time(NULL);
srand(seed);
}
for(i = 0; i < DECKSIZE; i++)
{
int value = -1;
do
{
value = rand() % DECKSIZE;
}
while(drawn[value] != 0);

/* mark value as used */
drawn[value] = 1;

/* debug statement */
printf("%i\n", value);
pdeck->card[i] = value;
}
pdeck->dealt = 0;
return;
}

把这个文件保存为 shuffle.