1. 问题
低版本的PHP可能会遇到不支持中文路径的情况:
(1) require('http://localhost/中文路径/test.php');
(2) require('\中文路径\test.php');
(3) $file = fopen('http://localhost/中文路径/test.php');
(4) $file = fopen('\中文路径\test.php');
(5) 通过浏览器访问: http://127.0.0.1/中文路径/test.php
在Windows10+Apache2.4.41+PHP5.6.40环境下,测试文件编码为UTF-8,会发现除了用fopen打开URL外(3),其他情况(包括用fopen打开物理路径)PHP都会报错:No such file or directory
注:使用fopen('url')或require('url')需要在php.ini中进行配置
; Whether to allow the treatment of URLs (like http:// or ftp://) as files.
; http://php.net/allow-url-fopen
allow_url_fopen = On
; Whether to allow include/require to open URLs (like http:// or ftp://) as files.
; http://php.net/allow-url-include
allow_url_include = On
查看浏览器请求头,(5)的“中文路径”也被编码为UTF-8,如果对路径字符串进行转码:
(1) require(iconv('utf-8', 'gbk', 'http://localhost/中文路径/test.php'));
(2) require(iconv('utf-8', 'gbk', '\中文路径\test.php');
(3) $file = fopen(iconv('utf-8', 'gbk', 'http://localhost/中文路径/test.php'));
(4) $file = fopen(iconv('utf-8', 'gbk', '\中文路径\test.php');
(5) 通过浏览器访问: http://127.0.0.1/php/%D6%D0%CE%C4%C2%B7%BE%B6/form.php
发现:(2)和(4)成功运行,(1),(3),(5)报错,但这次不是PHP报错,而是Apache报错:HTTP/1.1 403 Forbidden
|
物理路径(utf-8) |
物理路径(gbk) |
URL(utf-8) |
URL(gbk) |
fopen |
Invalid argument/ No such file or directory |
成功 |
成功 |
HTTP/1.1 403 Forbidden |
require |
Invalid argument/ No such file or directory |
成功 |
Invalid argument/ No such file or directory |
HTTP/1.1 403 Forbidden |
据此得出结论:
- 用require和fopen打开URL,会向Apache服务器请求资源,但Apache只支持解析UTF-8编码的URL
- 用require和fopen打开物理路径,直接与Windows文件系统交互,即ANSI编码
注:require会调用compile_filename,而在compile_filename会进行路径解析。
但是,为什么用浏览器或者require打开UTF-8或者GBK编码的URL都会失败呢?
2. PHP与Apache主要通信方式
2.1 CGI方式
CGI英文叫做公共网关接口,就是Apache在遇到PHP脚本的时候会将PHP程序提交给CGI应用程序(php-cgi.exe)解释,解释之后的结果返回给Apache,然后再返回给相应的请求用户。这种模式速度慢(php解释器不是常驻内存的)、占用空间(请求一次开启一次cgi)。已经被fast-cgi代替。
在Apache中配置:
Action application/x-httpd-php “/php/php-cgi.exe”
2.2 模块化方式(默认)
PHP作为Apache的一个模块(mod_php)运行,随apache一起启动,属于一个进程,之间的通信是内部通信。mod_php 这种嵌入的方式最大的弊端就是内存占用大,不论是否用到 PHP 解释器都会将其加载到内存中,典型的就是处理CSS、JS之类的静态文件是完全没有必要加载解释器。
2.3 FastCGI方式
这种形式是CGI的加强版本,CGI是单进程,多线程的运行方式,程序执行完成之后就会销毁,所以每次都需要加载配置和环境变量fork-and-execute(创建-执行)。而FastCGI则不同,FastCGI 像是一个常驻 (long-live) 型的 CGI,它可以一直执行着,只要激活后,不会每次都要花费时间去 fork 一次。FastCGI进程管理器自身初始化,启动多个CGI解释器进程 (在任务管理器中可见多个php-cgi.exe)并等待来自Web Server的连接。FastCGI与Apache是两个独立的进程,通过端口通信。
它的具体实现到php中就是php的php-fpm模块,但是在apache中是用的专门的fastcgi模块,需要下载.so文件,php-fpm在php5.3以后不再作为第三方的模块而是集成到了php中,它会提前的开启多个cgi程序,管理这些进程,并提供方式合理有效的调度,保证了并发性。
3. Apache与PHP交互过程
3.1 Apache生命周期
3.2 Apache处理流程
- Post-Read-Request阶段: 在正常请求处理流程中,这是模块可以插入钩子的第一个阶段。对于那些想很早进入处理请求的模块来说,这个阶段可以被利用。
- URI Translation阶段 : Apache在本阶段的主要工作:将请求的URL映射到本地文件系统。模块可以在这阶段插入钩子,执行自己的映射逻辑。mod_alias就是利用这个阶段工作的。
- Header Parsing阶段 : Apache在本阶段的主要工作:检查请求的头部。由于模块可以在请求处理流程的任何一个点上执行检查请求头部的任务,因此这个钩子很少被使用。mod_setenvif就是利用这个阶段工作的。
- Access Control阶段 : Apache在本阶段的主要工作:根据配置文件检查是否允许访问请求的资源。Apache的标准逻辑实现了允许和拒绝指令。mod_authz_host就是利用这个阶段工作的。
- Authentication阶段 : Apache在本阶段的主要工作:按照配置文件设定的策略对用户进行认证,并设定用户名区域。模块可以在这阶段插入钩子,实现一个认证方法。
- Authorization阶段 : Apache在本阶段的主要工作:根据配置文件检查是否允许认证过的用户执行请求的操作。模块可以在这阶段插入钩子,实现一个用户权限管理的方法。
- MIME