搜索
查看: 2811|回复: 0

Excel中字符串的截取

[复制链接]

978

主题

1094

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
15950
发表于 2018-2-20 22:02:02 | 显示全部楼层 |阅读模式
本文主要用来讨论没有分隔符情况下的单元格字符串处理,像空格、逗号类似的能够明显分割字符串的情况可以采用【分列】功能直接处理。
主要是利用函数公式进行截取字符串,涉及函数有:clean,left,right,len,lenb,find,min。
【注】:本文建立在字符串中无空格的前提下,如果有空格可以先用替换为空的方式处理掉,如果必须保留空格,本文的处理方法可能不适用。

首先,我们处理的是无空格的字符串,但是实际情况不可能这么理想化,数据的来源也是各不相同,尤其是网络抓取的数据,其中有些特殊字符直接观察难以发现,比如“\n”,Excel函数无法识别正则表达式,这种情况我们就要先清理单元格字符串,去除一些无法识别但又占位的字符,我们一般用clean函数来处理:
=CLEAN(A1)
我们默认处理的单元格都在A1上。以下方法都在建立在清理后的字符串的基础上的。
中文+数字:比较常见的是分离“姓名+手机号”,这种情况比较好处理,例如:张三15812345678,李小明13512345678,我们观察发现这种情况姓名的长度不一致,但是手机号的长度是一样的,都是11位,那我们可以先取手机号:
=RIGHT(A1,11)
这样我们就得到了手机号,姓名怎么取呢?可以用总的字符串长度-手机号的长度:
=LEFT(A1,LEN(A1)-11)
这样就取到了姓名,当然这是比较理想的情况,必须保证所有的数据都是非常规整的,只要手机号长度不是11位的,那么处理结果就是错的。那怎么办呢,其实有时候的错误结果也不是坏事,因为你可以从错误结果中知道,那些人的数据是错误的,这种情况只适用于数据量比较小的时候,如果数据量比较大,那么人工检查效率是非常低的,那么怎么兼容处理手机号的问题呢?这里我们用另一种方法先取姓名:
=LEFT(A1,LENB(A1)-LEN(A1))
这个函数公式怎么来的,LEN和LENB的区别是前者把中文作为一个字符长度,而后者则作为两个字符长度。所以LENB(A1)-LEN(A1)就是左侧中文的字符长度,这样就可以直接获取姓名,既然姓名的长度有了,剩下的手机的长度就是总长度-姓名长度:LEN(A1)-(LENB(A1)-LEN(A1)),即2LEN(A1)-LENB(A1),那么手机号:
=RIGHT(A1,2LEN(A1)-LENB(A1))
这样看来第二种方法的兼容性更加好。不过分离中文+数字在Excel2013以上版本中不用这么麻烦,只需要使用快速填充功能即可完成。
中文+数字+中文:这种情况略微复杂些,因为头尾都有中文,上面的解决方案就不适用,比如常见的“姓名+电话+公司名”,这种情况就涉及到FIND函数来确定中间数字的起始位置。我们先检查数字首次出现的位置:
=MIN(FIND({0;1;2;3;4;5;6;7;8;9},A1&1234567890))
FIND函数用来查找字符串中对应字符首次出现的位置,{0;1;2;3;4;5;6;7;8;9}表示查找字符集0-9每个数首次出现的位置,并返回0首次出现的位置,如果有一个数没有查到,则返回#VALUE!,为了保证0-9都出现,我们在A1后边加了“1234567890”,保证有返回值。但是首次出现的未必是0,可能是其他9个数字的任意一个,所以我们又在这个数据结果集外面用了MIN,用来返回第一个数字的位置。
知道了第一个数字的位置,我们马上可以截取左边中文的内容:
=LEFT(A1,MIN(FIND({0;1;2;3;4;5;6;7;8;9},A1&1234567890))-1)
中间数字部分:
=MID(A1,MIN(FIND({0;1;2;3;4;5;6;7;8;9},A1&1234567890)),2LEN(A1)-LENB(A1) )
剩余的中文就好处理了,这个要利用已经获取的左侧中文和数字的长度,结合总长度,用RIGHT函数就可取出,这里就不赘述了。
其实本文讲的方法也只适用于部分数据格式,并不适用所有情况,但我们可以随机应变,总有方法解决问题。




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

表格智创网

网站简介:表格智创网,是一家以表格设计和技能分享的专业社区,由会计帮帮网投资建设,尽专业,助提高专业技能。

表格智创网欢迎您!

联系我们

  • 工作时间:早上9:00-16:00
  • 客服电话:18668755857
  • 本站网址:www.excelwps.com
  • 淘宝店址:kjbbw.taobao.com

Powered by Discuz! X3.4 © 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表