- 参考链接:
RL——多阶段决策-贯序决策-马尔科夫决策
目标
- 区分多阶段决策-贯序决策-马尔科夫决策之间的区别和联系
决策过程分析
- 百度百科
马尔可夫决策过程(Markov Decision Process, MDP)是序贯决策(sequential decision)的数学模型,用于在系统状态具有马尔可夫性质的环境中模拟智能体可实现的随机性策略与回报
多阶段决策是指决策者在整个决策过程中做出时间上先后有别的多项决策。它通常比只需做出一项决策的单阶段决策要复杂,它或是要决策者一次确定各阶段应选择的一串最优策略,或是找出表示一个过程内连续变化的一条控制变量曲线,或是确定适合不同状态的灵活策略。
序贯决策是指按时间顺序排列起来,以得到按顺序的各种决策(策略),是用于随机性或不确定性动态系统最优化的决策方法。
RL——方差与偏差
General——深刻认识URL
你真的认识URL了吗?
URL中的#
字符
#
在URL中与服务器无关,也就是说正常访问服务器的URL不包含#
#
仅仅与本地浏览器对网页的定位相关#
由于不影响对远程服务器的访问,自然也不会存在于软件包的下载连接中
URL的正则表达式
参考博客:https://blog.csdn.net/qq_25384945/article/details/81219075
Python
1
http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+
JavaScript
1
/((([A-Za-z]{3,9}:(?:\/\/)?)(?:[\-;:&=\+\$,\w]+@)?[A-Za-z0-9\.\-]+|(?:www\.|[\-;:&=\+\$,\w]+@)[A-Za-z0-9\.\-]+)((?:\/[\+~%\/\.\w\-_]*)?\??(?:[\-\+=&;%@\.\w_]*)#?(?:[\.\!\/\\\w]*))?)/
Java
1
^(https?|ftp|file)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]
Python