【编码】PHP中文路径问题详解

news2024/11/18 9:36:11

1. 问题

低版本的PHP可能会遇到不支持中文路径的情况:

(1) require(‘http://localhost/中文路径/test.php’);

(2) require(‘\中文路径\test.php’);

(3) $file = fopen(‘http://localhost/中文路径/test.php’);

(4) $file = fopen(‘\中文路径\test.php’);

(5) 通过浏览器访问: http://127.0.0.1/中文路径/test.php

在Windows10+Apache2.4.41+PHP5.6.40环境下,测试文件编码为UTF-8,会发现除了用fopen打开URL外(3),其他情况(包括用fopen打开物理路径)PHP都会报错:No such file or directory

  ; Whether to allow the treatment of URLs (like http:// or ftp://) as files.
  ; http://php.net/allow-url-fopen
  allow_url_fopen = On
  ; Whether to allow include/require to open URLs (like http:// or ftp://) as files.
  ; http://php.net/allow-url-include
  allow_url_include = On

查看浏览器请求头,(5)的“中文路径”也被编码为UTF-8,如果对路径字符串进行转码:

(1) require(iconv(‘utf-8’, ‘gbk’, ‘http://localhost/中文路径/test.php’));

(2) require(iconv(‘utf-8’, ‘gbk’, ‘\中文路径\test.php’);

(3) $file = fopen(iconv(‘utf-8’, ‘gbk’, ‘http://localhost/中文路径/test.php’));

(4) $file = fopen(iconv(‘utf-8’, ‘gbk’, ‘\中文路径\test.php’);

(5) 通过浏览器访问: http://127.0.0.1/php/%D6%D0%CE%C4%C2%B7%BE%B6/form.php

发现:(2)和(4)成功运行,(1),(3),(5)报错,但这次不是PHP报错,而是Apache报错:HTTP/1.1 403 Forbidden
在这里插入图片描述
据此得出结论:

用require和fopen打开URL,会向Apache服务器请求资源,但Apache只支持解析UTF-8编码的URL

用require和fopen打开物理路径,直接与Windows文件系统交互,即ANSI编码

注:require会调用compile_filename,而在compile_filename会进行路径解析。

但是,为什么用浏览器或者require打开UTF-8或者GBK编码的URL都会失败呢?

2. PHP与Apache主要通信方式

2.1 CGI方式

CGI英文叫做公共网关接口,就是Apache在遇到PHP脚本的时候会将PHP程序提交给CGI应用程序(php-cgi.exe)解释,解释之后的结果返回给Apache,然后再返回给相应的请求用户。这种模式速度慢(php解释器不是常驻内存的)、占用空间(请求一次开启一次cgi)。已经被fast-cgi代替。

在Apache中配置:

Action application/x-httpd-php “/php/php-cgi.exe”

2.2 模块化方式(默认)

PHP作为Apache的一个模块(mod_php)运行,随apache一起启动,属于一个进程,之间的通信是内部通信。mod_php 这种嵌入的方式最大的弊端就是内存占用大,不论是否用到 PHP 解释器都会将其加载到内存中,典型的就是处理CSS、JS之类的静态文件是完全没有必要加载解释器。
在这里插入图片描述

2.3 FastCGI方式

这种形式是CGI的加强版本,CGI是单进程,多线程的运行方式,程序执行完成之后就会销毁,所以每次都需要加载配置和环境变量fork-and-execute(创建-执行)。而FastCGI则不同,FastCGI 像是一个常驻 (long-live) 型的 CGI,它可以一直执行着,只要激活后,不会每次都要花费时间去 fork 一次。FastCGI进程管理器自身初始化,启动多个CGI解释器进程 (在任务管理器中可见多个php-cgi.exe)并等待来自Web Server的连接。FastCGI与Apache是两个独立的进程,通过端口通信。

它的具体实现到php中就是php的php-fpm模块,但是在apache中是用的专门的fastcgi模块,需要下载.so文件,php-fpm在php5.3以后不再作为第三方的模块而是集成到了php中,它会提前的开启多个cgi程序,管理这些进程,并提供方式合理有效的调度,保证了并发性。

3. Apache与PHP交互过程

3.1 Apache生命周期

在这里插入图片描述

3.2 Apache处理流程

在这里插入图片描述
1.Post-Read-Request阶段: 在正常请求处理流程中,这是模块可以插入钩子的第一个阶段。对于那些想很早进入处理请求的模块来说,这个阶段可以被利用。

2.URI Translation阶段 : Apache在本阶段的主要工作:将请求的URL映射到本地文件系统。模块可以在这阶段插入钩子,执行自己的映射逻辑。mod_alias就是利用这个阶段工作的。

3.Header Parsing阶段 : Apache在本阶段的主要工作:检查请求的头部。由于模块可以在请求处理流程的任何一个点上执行检查请求头部的任务,因此这个钩子很少被使用。mod_setenvif就是利用这个阶段工作的。

4.Access Control阶段 : Apache在本阶段的主要工作:根据配置文件检查是否允许访问请求的资源。Apache的标准逻辑实现了允许和拒绝指令。mod_authz_host就是利用这个阶段工作的。

5.Authentication阶段 : Apache在本阶段的主要工作:按照配置文件设定的策略对用户进行认证,并设定用户名区域。模块可以在这阶段插入钩子,实现一个认证方法。

6.Authorization阶段 : Apache在本阶段的主要工作:根据配置文件检查是否允许认证过的用户执行请求的操作。模块可以在这阶段插入钩子,实现一个用户权限管理的方法。

7.MIME Type Checking阶段 : Apache在本阶段的主要工作:根据请求资源的MIME类型的相关规则,判定将要使用的内容处理函数。标准模块mod_negotiation和mod_mime实现了这个钩子。

8.FixUp阶段 : 这是一个通用的阶段,允许模块在内容生成器之前,运行任何必要的处理流程。和Post_Read_Request类似,这是一个能够捕获任何信息的钩子,也是最常使用的钩子。

9.Response阶段 : Apache在本阶段的主要工作:生成返回客户端的内容,负责给客户端发送一个恰当的回复。这个阶段是整个处理流程的核心部分。

10.Logging阶段 : Apache在本阶段的主要工作:在回复已经发送给客户端之后记录事务。模块可能修改或者替换Apache的标准日志记录。

11.CleanUp阶段 : Apache在本阶段的主要工作:清理本次请求事务处理完成之后遗留的环境,比如文件、目录的处理或者Socket的关闭等等,这是Apache一次请求处理的最后一个阶段。

3.3 mod_php工作周期

1.Apache接受请求

2.Apache传递请求给mod_php

3.mod_php定位磁盘文件,并加载到内存中

4.mod_php编译源代码成为opcode树(APC)

5.mod_php执行opcode树

4. 结论

4.1 两次资源检查

根据上述工作流程可大致推断:

通过浏览器访问url产生一个request,Apache服务器会检查是否允许访问请求的资源,要求url是UTF-8编码;
mod_php会通过Apache传递的请求定位磁盘文件,这里可能要求是GBK编码,因此PHP报错(仅猜测,具体Apache传递给PHP的请求是什么格式暂时不清楚);

4.2 远程文件

对于require(url),这个过程可能更加复杂:

安全警告

远程文件可能会经远程服务器处理(根据文件后缀以及远程服务器是否在运行 PHP 而定),但必须产生出一个合法的 PHP
脚本,因为其将被本地服务器处理。

根据这条警告的意思,如果远程服务器在运行PHP,通过include/require请求的PHP文件可能会被处理,然后收到一个包含了静态的HTML的PHP脚本,如果远程服务器没有运行PHP,那么将收到原始的PHP脚本在本地进行执行。由于测试请求的是本地的PHP文件,远程服务器就相当于本地环境,远程服务器同样进行了两次资源检查导致出错。

4.3 替代解决方案

设置->语言设置->管理语言设置->更改系统区域设置->勾选Beta版使所有程序都用Unicode UTF-8提供语言支持,但在运行其他文件时可能出现乱码。

4.4 使用PHP7

如果使用PHP7,以上问题全都不会出现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/63201.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringCloud框架(一):环境搭建 生产和消费 RestTemplate,底层源码解读

环境搭建 生产和消费 RestTemplate,底层源码解读SpringCloud环境搭建:生产和消费 RestTemplateSpringCloud的服务调用SpringBootApplication业务调用方法一: 通过静态工厂去拿业务调用方法二: 通过注入依赖去拿Template的底层源码…

BI国产化,必须要弄懂的2个关键

自“十四五”以来,我国诸多政策开始推动信创产业的深入,实现关键数字技术自主研发和自主可控。我国信创产业竞争力不断突破,国产化进程稳步推进。2022年开始政策重点提及“数字经济”、“数字政府”和国家信息化。在此背景下,BI产…

造物数藏:以数字藏品为契机 不断完善应用场景探索

数字时代已至,文化艺术作品的表现形式、传播途径都发生了变化,中华民族上下五千年的文化瑰宝得以借助新的形式被传承弘扬。而数字技术在发展过程中,也逐渐与文化产业水乳交融,孕育出数字文化产业新业态。数字藏品在近两年的突然红…

MySQL高可用MHA

目录 一.MHA概述 1.1 什么是MHA 1.2 MHA的组成 1.3 MHA的特点 二.MHA的工作原理 2.1 MHA的优点总结 三、实现过程 3.1 准备实验 Mysql 的 Replication 环境 3.1.1 相关配置 3.1.2 初始主节点 master 的配置 3.1.3 所有 slave 节点依赖的配置 3.1.4 配置一主多从复制…

VINS学习04———Omni教程

1. 本文简介 本文依照港科大开源的代码和论文 文章主要内容:对无人机集群实现协同定位。参与融合的定位因子有以下4点 全向鱼眼相机的VIO定位:VINS-Fisheye基于地图定位:视觉特征点协同建图基于UWB协同定位:节点间测距视觉检测定…

爆款小游戏用的都是什么游戏开发引擎?

随着微信生态中,小程序应用指数级的增长,许多休闲游戏变成为了众多游戏厂商流量变现的新手段。以近期很火的“羊了个羊”为例,它便是我们常常所说的小游戏。 游戏和小游戏的区别 要盘点小游戏开发引擎之前,我们得先来了解下游戏和…

[附源码]计算机毕业设计基于Springboot校园招聘系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

jQuery 效果- 动画

jQuery animate() 方法允许您创建自定义的动画。 jQuery 动画实例 jQuery jQuery 动画 - animate() 方法 jQuery animate() 方法用于创建自定义动画。 语法: $(selector).animate({params},speed,callback); 必需的 params 参数定义形成动画的 CSS 属性。 …

如何优雅的排空节点上的pod?云服务商是如何回收机器的?

概述 在 Kubernetes 中,不仅容器和 Pod 可以更换,节点也可以更换。Kubernetes 中的节点是 VM、服务器和其他具有计算能力的实体 (其实对k8s来说就是一个对象),在这些实体中运行 Pod 和容器。 节点耗尽是一种允许用户…

Matplotlib入门[01]——Pyplot

Matplotlib入门[01]——Pyplot 参考: https://ailearning.apachecn.org/Matplotlib官网 使用Jupyter进行练习 Matplotlib简介 matplotlib 是一个 Python 的 2D 图形包。 在线文档:http://matplotlib.org ,提供了 Examples, FAQ, API, Galle…

【架构设计】互联网架构项目架构演进以及三高设计概述

系统架构并非一蹴而就,架构目标也是随着业务发展而变化,业务推送技术发展,技术反哺业务。系统架构演进:单机 -->集群 -->分布式微服务 架构演进(日活用户占总用户量大概%4到%10,推测总用户量&#x…

Python配置OpenCV

一、背景 有个任务需要进行图像样本扩充,本人想要使用cv2来帮忙扩充电脑重装过系统,之前的环境都没有了参考之前自己写的博客,使用Anaconda安装失败了,一直显示下面的错误,目前还没有解决这个问题 Script file H:\An…

手把手教你音乐服务器搭建

最近发现,经常用的网易云音乐,有很多歌曲下架了,能听的越来越少了;歌单里的一些歌曲,现在要开通 VIP 才能听了。其实自己常听的歌曲不是很多,现在却有很多听不了了。 怎么办呢,付费吗?花钱当然是一个好方式,花 1 分钟开通 VIP,立马就可以畅听起来。 不过前两天翻东西…

RabbitMQ-全面详解(学习总结---从入门到深化)

RabbitMQ概念_MQ 消息队列 MQ全称Message Queue(消息队列),是在消息的传输过程中保 存消息的容器。多用于系统之间的异步通信。 1、同步通信相当于两个人当面对话,你一言我一语。必须及时回复 2、异步通信相当于通过第三方转述对话…

看完这套 Java 笔记,才明白笔者同时斩获 7 份大厂 offer 是有原因的

不知道各位程序员朋友有没有做笔记的习惯?不过,我觉得大家还是蛮喜欢收藏笔记的,嘿嘿,我也是。 前几天恰好看到一篇文章,里面详细罗列了关于 Java 的所有知识点。看目录,是从 Jvm 开始,再讲集合…

百趣土壤非靶标代谢组学文献分享,来自Microbiome的灵感

​今天小编要和大家分享的是BIOTREE协助客户发表在Microbiome上的关于土壤抗性遗传的一篇文章。 发表期刊:《Microbiome》 影响因子:9.133 合作单位:南京农业大学 据百趣代谢组学小趣了解,植物方面的高分文章并不好发&#xff…

二分查找详解

🌈🌈😄😄 欢迎小伙伴来到茶色岛独家岛屿,本期会对二分查找进行详细的讲解,做好准备了么,那么开始吧。 🌲🌲🐴🐴 一、简介 二、查找思路&#xff…

更快更稳更安全!天翼云CDN了解一下

近年来,数字化转型正催生各行各业掀起新一轮的信息变革。作为我国经济发展的“血液”,金融行业的一举一动都牵动着国民经济的神经。相对于其他行业,金融业务因其“高敏感性、高价值”等特点,行业数字化转型需要在保障安全和隐私等…

【基础算法】圆周率的多种方法求算 C++实现

●割圆法 一个圆如下面左图所示,其半径为1,其内部内接一个正六边形。设正六边形的边长为y1。由几何知识可得知y11,所以圆的周长可近似为正六边形的周长C6y16.所以圆周率为前面的近似圆周长与圆直径之比,即C/2 3≈π,这…