memcpy是memory copy的缩写,意为内存复制,在写C语言程序的时候,我们常常会用到它。它的函原型如下:
void *memcpy(void *dest, const void *src, size_t n);
它的功能是从src的开始位置拷贝n个字节的数据到dest。如果dest存在数据,将会被覆盖。memcpy函数的返回值是dest的指针。memcpy函数定义在string.h头文件里。自己实现的时候,最简单的方法是用指针按照字节顺序复制即可。但是性能太低:
- 其一,一次一个字节效率太低,地址总线一般是32位,能搬运4字节,一次一个肯定慢的不行;
- 其二,当内存区域重叠时会出现混乱情况。
下边根据以上两方面考虑提高memcpy函数的性能。首先考虑速度,可以按照 CPU 位宽搬运数据,效率更高,代码如下:
void * Memcpy1(void *dst, const void *src, size_t num)
{
int nchunks = num/sizeof(dst); /*按CPU位宽拷贝*/
cout<<"sizeof(dst)是:"<<sizeof(dst)<<endl;
int slice = num%sizeof(dst); /*剩余的按字节拷贝*/
unsigned long * s = (unsigned long *)src;
unsigned long * d = (unsigned long *)dst;
while(nchunks--)
*d++ = *s++;
while (slice--)
*((char *)d++) =*((char *)s++);
return dst;
}
sizeof(dst)是4,即大部分数据每次按照4字节拷贝,最后不足4字节的再分别拷贝。但是内存区域出现重叠时,这种方法无法规避内存混乱问题。下面的方法能够规避内存重叠的bug,代码如下:
void *Memcpy2(void *dest, const void *src, size_t count)
{
char *d;
const char *s;
if (((int)dest > ((int)src+count)) || (dest < src))
{
d = (char*)dest;
s = (char*)src;
while (count--)
*d++ = *s++;
}
else /* overlap */
{
d = (char *)((int)dest + count - 1); /* 指针位置从末端开始,注意偏置 */
s = (char *)((int)src + count -1);
while (count --)
*d-- = *s--;
}
return dest;
}
如果检测到内存区域有重叠部分,则从末端开始对每个字节进行拷贝。但数据量大时速度慢,将两种方法结合后能够提高拷贝函数性能,代码如下:
void *Memcpy(void *dest, const void *src, size_t count)
{
cout<<"sizeof(dest)是:"<<sizeof(dest)<<endl;
int bytelen=count/sizeof(dest); /*按CPU位宽拷贝*/
int slice=count%sizeof(dest); /*剩余的按字节拷贝*/
unsigned int* d = (unsigned int*)dest;
unsigned int* s = (unsigned int*)src;
if (((int)dest > ((int)src+count)) || (dest < src))
{
while (bytelen--)
*d++ = *s++;
while (slice--)
*(char *)d++ = *(char *)s++;
}
else /* overlap重叠 */
{
d = (unsigned int*)((unsigned int)dest + count - 4); /*指针位置从末端开始,注意偏置 */
s = (unsigned int*)((unsigned int)src + count -4);
while (bytelen --)
*d-- = *s--;
d++;s++;
char * d1=(char *)d;
char * s1=(char *)s;
d1--;s1--;
while (slice --)
*(char *)d1-- = *(char *)s1--;
}
return dest;
}
资料直通车:Linux内核源码技术学习路线+视频教程内核源码
学习直通车:Linuxc/c++高级开发【直播公开课】
零声白金VIP体验卡:零声白金VIP体验卡(含基础架构/高性能存储/golang/QT/音视频/Linux内核)
对比一下,测试代码如下:
int main(){
char a[20]="1133224466558877990";
// Memcpy1(a+2,a,5);
// Memcpy2(a+2,a,5);
Memcpy(a+2,a,5);
cout<<a<<endl;
cin.get();
}
运行结果:Memcpy1:1111333466558877990
Memcpy2:1111332466558877990
Memcpy:1111332466558877990
后两种方法正确,第一种方法拷贝时无法规避内存重叠的bug。
原文作者:wykup