打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Python非标准的日期字符串处理(解析、转换、比较) | 王晔的流水账

我之前有篇文章介绍利用VB/VBScript根据出生日期来计算年龄,文中介绍了函数ComputeAge,当时为了处理一些Word或者Excel中非标准的时间的,当然这个函数除了能计算年龄外也能转换这些非标准的时间字符串到程序语言支持的时间变量。

只要不是太畸形的时间字符串表示法,基本上ComputeAge都能处理,不过这次有个项目需要用到Python,于是要写个类似的函数来分析处理非标准的时间表示字符串。

当然我不想像上次那样写上一堆if,然后再用程序语言专有函数来分割处理字符串,再转换,太吃力不讨好了,所以我这次尝试使用正则表达式进行模式匹配切割字符串。

我分析了形如19920203、199203、1992.02.03、1992.02、1992-02-03、1992-02、920203时间格式特征,列出了正则表达式如下:

^((?:19|20)?\d{2})[-.]?((?:[0-1]?|1)[0-9])[-.]?((?:[0-3]?|[1-3])[0-9])?$

当然这个表达式还不是很完善,只能做简单的切割,不能判断日期的合法性,关于日期是否合法,我还是交给Python的时间功能来处理吧。

根据上面的正则表达式,我写的DateParser类如下:

import reimport datetime # ***************************************************# *# * Description: 非标准的日期字符串处理# * Author: wangye  <pcn88 at hotmail dot com># * Website: http://wangye.org# *# ***************************************************class DateParser(object):     def __init__(self):        self.pattern = re.compile(        r'^((?:19|20)?\d{2})[-.]?((?:[0-1]?|1)[0-9])[-.]?((?:[0-3]?|[1-3])[0-9])?$'def __cutDate(self, date, flags):        y = date.year        m = date.month if flags[1] else 1        d = date.day if flags[2] else 1        return datetime.date(y, m, d)     def __mergeFlags(self, flags1, flags2):        l = []        length = min(len(flags1), len(flags2))        for i in range(0, length):            if flags1[i] and flags2[i]:                l.append(True)            else:                l.append(False)        returndef parse(self, strdate):        """        描述:时间解析方法。        参数:strdate 要分析的时间字符串,比如目标时间类型datetime(1992, 2, 3)              可以被解析的是下述字符串之一:            19920203             199203            1992.02.03            1992.02            1992-02-03            1992-02            920203        返回值:            如果成功            元组(datetime, flags),其中datetime表示转换完成的合法时间,        flags是标志位,表示有效位数,比如199202实际转换了年和月,日没有,        但是本函数将默认返回1日,但是flags将表示为(True, True, False),        前面两个True分别表示年和月被转换,最后一个False表示日没有被转换。            如果失败            返回None。        """        m = self.pattern.match(strdate)        flags = [False, False, False]        if m:            matches = list(m.groups())            flags = list(map(lambda x:True if x!=None else False, matches))            results = list(map(lambda x:int(x) if x!=None else 1, matches))            # results = list(map(lambda x:1 if x==None else x, results))            if results[0]<100:                if results[0]>9:                    results[0] += 1900                else:                    results[0] += 2000             return (datetime.date(results[0], results[1], results[2]), flags)        else:            return None     def convert(self, strdate, format):        """        描述:转换日期为指定格式。        参数:strdate 同parse方法的strdate参数。              format Python时间格式标识,同datetime.date.strftime格式化标识。        返回值:            如果成功,返回指定format格式的时间字符串。            如果失败,返回None。        """        date = self.parse(strdate)        if date:            date = date[0]            return datetime.date.strftime(date, format)        else:            return None     def compare(self, strdate1, strdate2):        """        描述:比较两个日期。        参数:strdate1 和 strdate2 同parse方法的strdate参数        返回值:            可以是下列值之一            -4  strdate1 无效,  strdate2 有效            -3  strdate1 有效,  strdate2 无效            -2  strdate1 和 strdate2 无效            -1  strdate1 < strdate2             0  strdate1 = strdate2             1  strdate1 > strdate2        """        date1,flags1 = self.parse(strdate1)        date2,flags2 = self.parse(strdate2)         if date1 == None and date2 != None:            return -4        if date1 != None and date2 == None:            return -3        elif date1 == None and date2 == None:            return -2         flags = self.__mergeFlags(flags1, flags2)        date1 = self.__cutDate(date1, flags)        date2 = self.__cutDate(date2, flags)         if date1>date2:            return 1        elif date1<date2:            return -1        else:            return 0

下面举几个例子供大家参考:

>>> DateParser().parse("19860126")(datetime.date(1986, 1, 26), [True, True, True])>>> DateParser().parse("199111")(datetime.date(1991, 11, 1), [True, True, False])>>> DateParser().parse("1991")(datetime.date(1919, 9, 1), [True, True, True])>>> DateParser().parse("8511")(datetime.date(1985, 11, 1), [True, True, False])>>> DateParser().convert("19911101", "%Y * %m * %d")'1991 * 11 * 01'>>> DateParser().convert("1990.1.01", "%Y.%m.%d")'1990.01.01'>>> DateParser().compare("1992.2", "19922")0>>> DateParser().compare("1992.2", "1956.03.1")1

这段代码片段我已经放到github的gist上了,如果大家发现什么Bug或者有什么好的建议欢迎提出。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
String 转换 java.sql.Date 和java.sql.Time 格式
java 日期与字符串转化 - - JavaEye技术网站
Python编程学习笔记(8)
javascript 日期相减-在线教程-先飞电脑技术网
Python计算两个日期之间的相差的秒数
日期在String和Date类型转换;ParsePosition,formatter.parse,java.sql.Timestamp
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服